add test result to report

10 years ago · bf0ece1810
--- a/README.md
+++ b/README.md
@@ -6,7 +6,7 @@

 ###本程序依赖data目录下面的data.zip和dictionary.zip先解压缩  data 目录下面的 data.zip到当前目录。

 *	新增说明3：增加基于 TF-IDF(词向量) 特征的文本分类程序。
 ###	新增说明3：增加基于 TF-IDF(词向量) 特征的文本分类程序。
 1. 主程序：DfIdfClassifier.java
 2. 效果如下：

@@ -17,7 +17,7 @@
 + 总共正确数 : 623
 + 总数：779

 *	新增说明2：增加基于 N-Gram(词向量) 特征的文本分类程序，目的是找出自己领域相关的文本，然后再从这个领域相关的文本中判断正负面。
 ###	新增说明2：增加基于 N-Gram(词向量) 特征的文本分类程序，目的是找出自己领域相关的文本，然后再从这个领域相关的文本中判断正负面。

 1. 测试语料：data/text_classification.zip 解压缩即可
 2. 运行程序：NGramClassifier.java 即可。
@@ -31,7 +31,7 @@
 +   government 271,			8
 +   others	 27,			473

 *	新增说明1：2015-04-10测试了不用中文分词器，分词之后 LingPipe 情感分类的准确率，同时测试了去除停用词之后的情感分类的准确率。
 ###	新增说明1：2015-04-10测试了不用中文分词器，分词之后 LingPipe 情感分类的准确率，同时测试了去除停用词之后的情感分类的准确率。


 1. 发现用HanLP的NLPTokenizer分词器，准确率最高，但是速度有点慢。