《深入浅出Pandas》是一本非常适合初学者的Python数据分析入门书籍。作者通过简单易懂的语言和实用的案例,详细介绍了Pandas的基础知识及其在数据分析中的应用。无论是数据清洗、数据整合还是数据可视化,都能在书中找到相应的解决方案。这本书是Python数据分析学习的不二之选。
深入浅出Pandas读后感篇一
本人从事数据开发方面的工作已有多时,但是对于 pandas一直没有一个非常清晰的头绪。python版的spark RDD也是借助pandas实现的,只知其用,但是在遇到一些复杂查询的时候知识储备就显得捉襟见肘。于是李老师发布这本书后,很快就入手了,排版优良印刷清晰。既可以作为入门书还可以作为工具书。应该可以帮助到学习数据分析的朋友们。
深入浅出Pandas读后感篇二
如果你不熟悉英文文档,又对搜索引擎提供的结果不太满意,那么这本书就很适合你。这是一本工具书,全是干货。作者非常诚恳,基本不提空洞乏味的理论,直接从数据需求入手,以解决问题为最终目的,show you the code。看完本书,你对pandas的认识将会上升到一个全新的高度。
几乎每个熟悉python的人都或多或少地使用过pandas,能利用pandas对数据做基本的操作。比如对dataframe适当地增删改查,对数据进行切片等,丝毫没考虑过如何对代码进行优化,遇到问题就去良莠不齐的技术博客中翻找。不过,你知道的功能很可能只是pandas的冰山一角。我承认,冰山一角能解决一些问题。但是呢,总有一天你会遇到使用高级功能的场景。你知道pandas直接封装了matplotlib吗?每次计算时间还需要调time包吗?不会有人去写for循环来给pandas的新列去赋值吧?拥有本书,你就会知道,原来pandas还有这么多奇妙的功能。
我和作者是网友,作者为人热情、坦诚,一直孜孜不倦地在微信群里为小白解决基础问题,为有经验者提供逻辑优化,属实用爱发电。听说买书了就可以进这个微信群,白嫖一波作者的经验值,岂不美哉。
深入浅出Pandas读后感篇三
作为一个非数据分析科班出身的攻城狮,为了应付工作之余的“内卷”,不得不对自己下起了狠手开始学习数据分析,从一开头查找相关工具及确定最终选定入门相比较容易的Python入手,期间也是一番波折。
初识作者,是在他的公众号“盖若”里,那时候利用微信的“搜一搜”查找Python相关的资料,无意中看到了一篇关于Pandas的函数应用文,从此就一发而不可收了。目前手里拿的这本《深入浅出Pandas》,就是这一“缘,妙不可言”的例证。
Python的使用场景主要集中在处理Excel高阶的数据分析,为我们实现高效办公提供了一种方法,同时Pandas是解决这类数据分析问题中比较强大的专业数据科学库之一。Pandas既能完成如书中第3-5章的基础操作,又能在数据建模、机器学习等更高层次的领域发挥重要作用。
从第6章开始,作者按照Pandas的处理流程完整演示了相关的功能及操作方法类型,并对一些常见的分析方法进行了概括。同时配合第10-12章的内容,对分类数据的应用场景和操作方法进行了实操,覆盖的知识点比较全面,同时对一些繁复的代码结构进行了“修剪”,从而使代码信息通俗易懂,逻辑结构清晰严谨,以便更好地查阅和演练。同时,在第13-16章,作者介绍了时间类型数据的Pandas处理方法与技巧及关于“数据可视化”方向的细节处理问题,不仅方便理解记忆还能增强视觉识记能力,实在是锦上添花的精心安排。
这本书可誉为 “Pandas圣经”,不仅解释了一些基础的理论概念及历史渊源,而且提供了如书中第17章中丰富的实战案例库可供大家实操练习,一方面锻炼了“抄作业”能力提高工作效率,同时也能够理顺思路,增强逻辑思考能力,从而达到举一反三、融会贯通的效果。
如果希望获得后续的案例及资料等更新,都可以加上作者的VX联系从而进入他的数据分析相关交流群,还可以到他的个人网站“盖若”上随时学习相关课程。
深入浅出Pandas读后感篇四
我从事数据开发的相关工作,平时接触pyflink、python spark和hive比较多,底层都不约而同的采用了pandas或者类似pandas的数据操作逻辑,偶然间了解到这本书,想着是时候补充一下pandas相关的知识了。
原本只是想作为一本参考书,没想到经常“参考”,发现自己虽然深处数据领域,但是对很多这本书中提到的处理方式都还不了解,于是才开始从头品读。
书的内容非常丰富,从基本的pandas到比较完整的案例都有涉及。前几章主要介绍了pandas的背景和两个对数据的基础封装dataframe和series:Pandas 可以说是 在Python数据科学领域应用最为广泛的工具之一。Pandas是一种高效的数据处理库,它以 dataframe 和 series 为基本数据类型,呈现出类似excel的二维数据。基于此,本书还介绍了对于 dataframe 和 series 相关的操作,可以覆盖大多数的使用场景。中间部分介绍了数据清洗的流程,并通过对时序数据的处理,实时绘制图表。最后介绍了pandas的常用场景和痛点,从实际使用的角度来对前面所学的东西融会贯通。借以此能够用pandas来提升读者的数据处理工作效率。
比较有意思的一点,作者是技术出身,但是行文的逻辑和语言的组织非常流畅表达非常精确,语言通俗易懂。使用到的仅仅是pandas和比较基础的python语法,对于非技术背景的朋友也能很好学习和上手。正如其名一样,深入浅出,既可以帮助初学者的pandas入门,也可以作为Pandas的参考。
时间关系,本书只是粗略读过一遍,在后来的不断深入中相信还有更多的认识,届时再来补评。希望能够对欲购买本书的朋友做一个参考。
最后附上作者对本书的定位: Python 初学者的百科全书,零基础快速入门,Python 工程师的速查手册,解决Pandas 使用中的各种疑难问题。
深入浅出Pandas读后感篇五
本人从大学开始使用接触pandas进行数据分析,距今已经有三年的pandas经验,目前主要是在金融行业从事数据分析的工作,这本书刚到三天,我已经看的过半,想借此聊聊看的感受,不那么专业的,粗浅的评价一下个人对于这本书的看法,优点以及缺点。
推荐人群:刚刚入门pandas数据分析或者在pandas上有一定学习基础的学习者
优点:
1.知识脉络框架清晰连贯,非常适合用于pandas的查询工具书!我在这几天的平时工作中,会有一些知识点有遗忘,如果选择百度的知识点往往很片面,不系统,但是从这本书的目录可以很快查询到相应知识点,并且会做一个很系统的讲解,比如在一些函数调用上,apply、map和pipeline的区别等。
2.知识体系先进,内容紧跟pandas的最新版本。这本书因为是最新出版的,所以它的很多pandas的知识内容都是紧紧围绕最新的pandas版本,并且里面的思维也都是最新的,比如关于流行的链式方法的使用等等。
3.时间序列分析模块很详细!我本人以前是处理出租车数据的,对这块的要求比较高,这本书对于时间序列分析模块的介绍很系统很全面,在网上的都是很零散的,所以非常适合进行学习
缺点:
1.缺乏对pandas分布式数据处理和时间优化相关内容知识的介绍,比如dask,hdfs等。虽然pandas在分布处理超大数据上不是主流,但是对于某些小众群体,比如我可能还会倾向于用pandas去做一些大数据相关的分布处理,希望作者后续有机会可以添加上述内容。
综上所述:
目前市面上几乎没有一本主流专注于介绍pandas的书籍,几乎都是以python为主出发去做详细的介绍,所以笔者认为该书极大填补了pandas教程在市面上的不足,如果你是从事数据分析等相关行业的,一定不容错过。
深入浅出Pandas读后感篇六
作为一个数据岗从业者,目前工作上有大量的数据分析内容要做,开始是从基本的表格处理入手,多数据源整理、建模、可视化分析,从数据到信息,从信息到洞见,随着数据量的急剧膨胀,原来靠表格或者写Sql不太能够覆盖住现有的工作,另外但凡是去面试规模大、场景复杂点的公司皆需要会python,而数分岗便特指要精通Pandas,作为一本可以放在身边随时查阅的工具书,这本书写的相当优秀:
1、开宗明义作者便就python与其它语言的比较做了解析,对于入行者来说,这减少了相当多的试错时间,若想进阶到高阶数据分析师段位,Pandas值得深度学习;
2、本人并非科班出身的程序员,读这本书没有任何障碍,作者是中台产品出身,在解构Pandas时,考虑了整体脉络和故事线,逻辑非常清晰,层层递进,照顾了初学者的底蕴,降低了学习门槛;
3、从书籍内容来说,掌握如何读取、生成数据,掌握不同的数据结构,及获取数据集内特定的元素,都做了清晰的解析;
4、本书定义是案头的工具书,但并不晦涩难懂,我们可以从常用函数逐步学习,边学边练,不必记住所有的函数,记得用法和结构,知道函数的作用,知道如何查询,边学边练,便可以逐步获得进阶; 5、本书提供了丰富的实操案例,可以顺着作者的思维逻辑,案例故事线跑一轮,先理解,解构作者看问题的视角,函数的运用,再考虑后续如何更优化;
6、当各种函数熟悉了后,建议 找一个相对复杂的案例跟随大佬提供的项目案例学习锚定问题、理解问题、理解商业、解构场景,调用更多库、函数,逐步强化用Pandas的函数功能解决具体问题。在逐步的练习过程中,了解每一步的作用和每一个符号代表着什么,动手过一遍,效果会更好。
7、Try to solve your own problem。在逻辑上,怎样的步骤可以实现?这是最重要的,提出问题,规划求解,反复练习,在书中学,在具体商业场景中练,找高人请教。如果遇到问题,可以先查询本工具书,官方文档,在找前辈请教勘误,这样提升更快。
8、作为一个懂业务、懂产品、懂架构、懂技术的人写的书,且书的内容反复推敲过,在我个人看来就算是全部处理好的各种菜品,就差喂我吃了,这是本非常值得入手,反复学习,常见常新的工具书。