软件开发案例-商机抓取工具

  • 0

软件开发案例-商机抓取工具

为了充分地获取商机,我们研发了一套抓取目标客户信息的网络爬虫,能在网络中快速的抓取目标客户的信息。

相关技术:Python,爬虫


  • 0

使用Python开发的定向数据采集框架

事实上现在已经有很多非常不错的数据采集工具了,有收费的也有免费的,闻道软件工作室在做第一个与爬虫相关的软件定制开发项目时最先考虑的方案就是使用现成的数据采集工具采集数据,然后再做二次加工。然而事与愿违,我们使用的好几款工具或多或少都有一些不尽人意的地方。要么是配置做得太死没办法扩展数据采集需求,要么是功能做得太强又导致配置相当复杂。为此,我们决定使用python写一个定向数据采集的框架。

“Read More”

  • 0

程序模拟网页提交、爬虫的常见方案及优劣势分析

闻道软件工作室已经做过多个使用软件模拟HTTP GET和POST请求的工具和系统,使用过多种方案。本文将对我们使用过的方案做一些分析和对比
1、C/C++作为开发语言,使用CURL开源库作HTTP请求。CURL功能强大,除了支持HTTP外还支持HTTPS。我们在多个系统和工具中使用了这个方案,比如模拟天翼Live协议的短信平台、模拟139协议的短信、彩信平台等。C/C++作为一种经典的开发语言,其开发出来的程序执行效率高、跨平台、程序扩展性以及稳定性容错性都较强,但是相对于其他方案对开发者的专业知识要求较高,除了要有扎实的C/C++编程功底意外、需要通过分析HTTP报文、甚至是分析JS、Jquery代码来得到具体页面中关键的参数。涉及到Web编程、HTTP协议、JS/Jquery语言等其他知识。在模拟天翼Live协议的短信平台这个系统中,我们还对天翼Live的客户端进行了逆向以获取一些加密算法和参数的细节。是本文列举的几个方案中开发难度最大,维护成本最高的方案,当然优势也不言而喻,开发出的系统功能强大,性能高,直接深入最底层协议开发灵活性最强。

“Read More”