关于大数据和Python的误区



经常会帮客户做一些数据收集的项目,网站上的网络数据进行采集归纳。客户多用来搜集用户QQ号码,电话,邮箱,传真,手机,网址,公司名称等进行网络营销。或者对某些行业数据,例如APP数据,商品销售数据进行采集处理进行调研总结,可用于学术研究。还有一种常见用途是采集数据填充网站数据。或其他需要采集数据的其他用途。

但是最近经常会遇到客户要求提供数据,并限制用Python。但是实际客户的需求仅仅是需要一批数据而已。当今各类宣传常常把大数据和Python捆绑在一起,实际上二者没有太多的必要的绑定关系。大数据隶属于统计学,Python只是一种用于大数据提取的一种语言工具。在Python之前,用于数据收集的程序语言很多,依然可以用于大数据提取,数据清洗和数据统计的。

以下摘自-百度百科:

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

Python是一种 计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。