一直略有研究数据采集这块,用过网络神采和火车头采集数据,其实数据采集是想到简单的。只需要略懂HTML知识,即可简单采集数据。 对于两款软件的使用,现将一般应用的几个方面测试效果对比給大家,仅供参考。   网络神采 V4.9  火车头V3.2 掉包情况  优秀,只要采集上了,几乎没有掉数据的情况  严重,用测试采集数据抓取正常,采集时掉数据的情况太多 耗时情况  良好,读取到哪里采集到哪里。  严重...

网络营销已经成为推广中不可或缺的一部分,前几天在google广告上看到卖种猪的都有足迹了。。。看来在家养猪也在挖心思在互联网上闯出自己的一片天地。开个玩笑,没有任何其他色彩。只是想说一下现在传统行业的一种新生发展力量。 个人不太喜欢玩微博,只是感觉都跟风的在玩它。不可否认,微博营销也有很大的市场。但有一个困境就是,想做宣传的可能有粉丝不够多,根本没有广告效果;粉丝足够多,有广告效果的大都是不屑于冒...

今天有一个客户需求是需要采集跳转网页的截图,用网络神采探测真实地址的方法,采集测试通过。 在高级选项里勾选探测真实地址,后采集虚拟网址即可。 有了真实网络地址列表以后,需要对它们批量网页截图保存。我们可以使用国外的免费软件 webshot。 批量URL在保存txt的时候,注意是一行一个。它会自动提取。其他图像和进程相关参数设置比较简单。 但vanfon在测试此软件的时候 发现新版本无法完成批量操作...