From dcfb7a41851a923d49c804dcf202e45d3d107838 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E6=80=9D=E9=80=9A=E6=95=B0=E7=A7=91=20StoneDT?= <13913853100@163.com> Date: Tue, 8 Mar 2022 14:25:05 +0000 Subject: [PATCH] update dataCollection.md. --- dataCollection.md | 3 --- 1 file changed, 3 deletions(-) diff --git a/dataCollection.md b/dataCollection.md index b96c31a..b2fa19f 100644 --- a/dataCollection.md +++ b/dataCollection.md @@ -1,6 +1,3 @@ -(待续,未完... ) - - ## 项目简述 舆情系统中数据采集是一个关键部分,此部分核心技术虽然由爬虫技术框架构建,但抓取海量的互联网数据绝不是靠一两个爬虫程序能搞定,特别是抓取大量网站的情况下,每天有大量网站的状态和样式发生变化以后,爬虫程序能快速的反应和维护。