数据清洗与准备

我认为这是最重要的一章。

在对视频中人物骨架识别的过程中,存在着关节点数据丢失的问题,因此心心念怎样对一些关节点抖动、丢失等问题,因此满怀期待通过数据清洗的方式对数据进行纠正。

缺失值

  • dropna
  • filllna
  • isnull
  • notnull

重点讲一下fillna 的用法,

df.fillna(value=vale , method ='ffill' , axis = axis , inplace = False, limit = limit) ## method 的方法是重点,inplace 意思是对本身数据进行操作,还是生成新的东西

df.fillna({'aa':0.4,'bb':0.3})  #对aa列、bb列的na进行赋值

数据转换

  • duplicated() #找出重复的东西
  • drop_duplicated() #直接去重了
meat_to_animal = {'banco':'pig' , 'hony ham':'bird'}
data=pd.DataFrame('food':['banco','hony ham'],'ounces':[1,2])

data ['food'].map(lambda x : meat_to_animal[x.lower()])

离散化和分箱

未完待续。

发表评论

电子邮件地址不会被公开。 必填项已用*标注