聊聊一款数据操作工具Pandas上

沈老师一直强调要同学们认真打好基础,更要经常总结自己在学习过程中的心得体会。这篇关于Pandas的闲聊就属于基本功类型的文章,近期公号推送的文章也将会是类似风格,力图尽可能详尽地梳理一款或几款工具的用法与使用心得。不积小流无以成江海,只有注重汇聚点滴才能在面对复杂问题时淡定自若。因为在数据科学中,多数复杂问题都可以拆解为一个个小问题,细化到各个知识点上,这也是结构化思维的一种体现。在科学计算领域中,如果要使用Python,那么肯定离不开三件套:NumPy,SciPy,Pandas。近期在原基础上又花了一些时间来深入学习Pandas,其实是因为它比Excel更全能,适合处理大量的数据,如果代码构成合理,方法适宜,基本不存在卡顿,这就是我使用Pandas的初衷。我认为,Pandas比NumPy和SciPy简单一些,可以先学习Pandas,然后根据工作中遇到的实际问题去涉足另外两个库。Pandas在NumPy和SciPy的数据操作功能之上集合了更多高级的数据操作功能,就像体操全能运动员:基本统计、高级统计、透视表、时间序列什么的处理起来都很得心应手,而且学习成本比较低,ROI比较高,特别是对于熟悉结构化数据库和Excel的同学来说,Pandas的命令会令你觉得亲切。Pandas的函数特别多,所以这篇闲聊集中







































北京治愈白癜风的医院
北京看白癜风正规医院



转载请注明:http://www.92nongye.com/ksfc/ksfc/204613087.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了