使用 python 对csv 数据进行分析,导出表格中相同数据数量

To analyze a CSV file using Python and count the occurrences of each unique value in a specific column, you can use the pandas library. Here’s a step-by-step guide on how to do it:

1. **Install pandas**: If you haven’t installed pandas, you can do so using pip. Open your command line or terminal and run:

“`bash
pip install pandas
“`

2. **Read the CSV File**: Use pandas to read the CSV file. You’ll need to know the name of the column you want to analyze.

3. **Count Unique Values**: Use pandas’ functionality to count the occurrences of each unique value in the desired column.

4. **Export the Counts**: The result can be exported to a new CSV file.

[……]

阅读更多

农村机会有多大

最近发现一个数据库。是记录中国乡镇城镇编码,顺带把中国的村镇标注了出来。然后我用程序采集了一下,看了一下他到底中国有多少个村。采集的任务跑起来以后。很惊讶。中国的村居然有六七十万。这是村的数量。

这个数量真的是非常超出想象。以为可能一两万个村儿就差不多了。没想到是。接近70万的数量。是采集的工具,在那采了几天都没有采完。

之前一直在做geo Json。后来发现,大家对于县里面。乡镇级别的界线标注非常少,开始我以为是不是因为这些数据需要花钱购买?后来发现中国的县区下面的乡镇的数量也是非常的庞大。
大家对于村镇级的标注很少。深圳的标记基本上只有一个村委会的定位地点。少有对边界做出细致划分的,这个数量确实是太惊人了,不可能有人去专门做这种分界线的制作。

而做地图这个事情确实是非常的耗费人力资源。是一个测绘加技术加劳动密集型产业。我们能够在这个时代享受在线地图带来的便利,完全是因为这些技术和采集技术的进步。

[……]

阅读更多

街景地图旅游

最近我想出去转转,但人实际走不出去,就考虑用地图全景去看看周围的世界。使用百度地图的街景来看国内的场景,用谷歌地图看国外的街景。

看的时候需要自己不停的点击前进,不过在没事的时候很适合云中漫步在其他的城市周边。

最近几天在地图上看了几个地方,日本附近较多,主要是试一下怎么能让地图记录上次街景所在位置,等下次进来以后再次从当前位置出发,我试着在离开前加上地理位置收藏,要不然下一次打开地图是基于现在地理位置定位,就会找不到上一次地图所在的位置。

[……]

阅读更多

应该试试语音写作

现在的手机输入法都支持语音写字输入。而且识别率都非常的精准。带一些常用词和口语化内容的输入上。书上基本上可以不需要修改。

如如果所以是说一些生僻词,可能语音输入法的识别还是按照大众输入的内容进行录入。所以语音输入法还需要做一些校正。总体来说还是大大的提高了输入效率。

而且有了AI技术以后,对于前面的内容还能进行更正和联想。对于语音的停顿和输入是不能有思考的,一旦你思考,他就会认为你有停顿,会给你加一个逗号或句号儿。

语音输入法还是适合比较短的句子的输入,如果你的内容比较复杂,具有专业度,而且还是很长的一个句子,那么很有可能他给你编写的内容就会超出你的想象范围,而且会让你变得无法校对。

[……]

阅读更多

成体系的学习

最近转换新的工作。需要把原来的一些知识再重新学一下。现在很多事情都只留了一点点碎片,记忆成体系的知识并没有。

所所以为了能够。快速的学习需要把原来的一些老知识进行一下整理。整理的过程中发现,要想成体系的学习,还是需要一些技巧的。要不然碎片化的知识。知识虽然有用,但是记录下来在整体的里面还是没有用。

在在整理这些老知识的时候,偶尔还会写一些博客内容。这些内容总的来说还是碎片化的零散知识。相对应的,零散的知识在写作的时候倒是很简单。但是再回顾过来,重新看的时候会发现缺少很多背景知识。

之只想搞一个成体系的。知识的一个脉络。

[……]

阅读更多

XAMPP增加一个子域名虚拟主机

最近想在本机测试一下php框架 CodeIgniter 4.4.3,想起本机有个XAMPP 不用折腾环境了,但是如何在 XAMPP 下面增加一个新的代码开发目录,增加虚拟主机都忘记了,记录下配置教程,避免后面找不到了。

编辑 XAMPP 目录下的虚拟主机配置:

[……]

阅读更多

AI:对深度学习人工智能进行提问和思考-001

最近一直想学习 AI 知识和应用,但是具体怎么用,怎么使用还是有些疑惑,已经生成 ai 在具体的实际使用中能起到什么作用我也一直在思考。

借鉴各种各样的百问专题,我想把这些我对 AI 能帮助我们做什么这样的一些问题来问问 AI 看看他们的解答和我们的思考是否能有匹配性。

今天进行了第一问,我们假设 AI 是一个我们学习和请教或者采访的对象,给 AI 提出关于 AI 问题的思考,看看 AI 知识库中对于这些问题是怎么考虑的。

第一次准备了三个问题,然后问 AI 由 AI 来作答。以后可以形成问题库,帮助我们熟悉 AI 解疑答惑。
问题1、AI 学会了互联网存在的大部分知识了吗?

[……]

阅读更多

火车头采集器使用记录

最近想采集一些新闻数据做下数据库,开始复杂的数据想用python来做采集来的,但python需要自己写函数,写存储逻辑代码,如果发布端是通用的cms的话,还需要考虑写一个发布入库的逻辑,做计划任务又要搞一通服务器配置,还有重新读一读cms程序的业务代码才能搞。

有些规范的数据就开始考虑用火车头采集器来采集尝试着把老版本火车头浏览器采集用起来,结果发现老版本已经装不上了。后来安装了最新的火车头采集器和火车头浏览器。

在服务器安装了火车头采集器,10.0版本,10版本支持json采集,字符串组装,计划任务什么的,而且预制了一些采集后的发布到常用cms程序的脚步本,但是不包含wordpress。

[……]

阅读更多

小时候,乡愁是一枚小小的邮票

小时候,乡愁是一枚小小的邮票,长大后,乡愁是一断断没有时间的旅途,在家里,在年少时的梦里,有着无数的感觉,每一个人,走在自己的世界里面,总是想要感受一下世界的变化。

想要做好生活,那就专心发展业务,业务增长了,才能真正明白什么样子的生活才是最好的追求。

精打细算过日子。

早上在教室里面坐着,没什么事情想梳理一下到底还有多少信用卡账单没有还,最后梳理了一下,发现这个月花呗加上信用卡,还有 3800 元的账单没有还。

从什么余额宝,笔笔攒,这些账单里

[……]

阅读更多

新尝试

最近一直想要做一些新的尝试,在现在感觉有些通缩的情况下,发现很多项目的进度都被迟缓了,不在有什么需要解决的问题了,就是做了一天又一天的。生活过得很快,每天感觉零散时间挺多,但真正能用起来的时间又很少,感觉接触起来那些新的事情都有些慢,折腾着找到一些笔记,做代理,做自己的想要的翻译,发现原来使用手机代理还是很慢的。

经常一个代理代码就要折腾半天,弄完常态化的内容,要做什么事情来着又忘记了,最后又想是不是应该再做点什么事情,一直重复在做一件事,又重复的做一件事情上,却忘记了应该每天规划好做什么事情比较方便。

早上来学校自习,就会觉得有学习焦虑,不过现在倒是对碎片时间的焦虑少了很多,事情总要一件一件的去安排和处理,等做完了一件事,又想要做一件事的时候就去做,现在不是能够立即出成绩的时候,现在又到了一个新的拜师的节奏,找到自己能够学习和模仿的人,让自己跟着学习和进步,然后产生自己的收益。

[……]

阅读更多

退出移动版