diff --git a/dataCollection.md b/dataCollection.md index b96c31a..b2fa19f 100644 --- a/dataCollection.md +++ b/dataCollection.md @@ -1,6 +1,3 @@ -(待续,未完... ) - - ## 项目简述 舆情系统中数据采集是一个关键部分,此部分核心技术虽然由爬虫技术框架构建,但抓取海量的互联网数据绝不是靠一两个爬虫程序能搞定,特别是抓取大量网站的情况下,每天有大量网站的状态和样式发生变化以后,爬虫程序能快速的反应和维护。