Browse Source

add test result to report

fetches/sdlf/master
gitclebeg 9 years ago
parent
commit
bf0ece1810
1 changed files with 3 additions and 3 deletions
  1. +3
    -3
      README.md

+ 3
- 3
README.md View File

@@ -6,7 +6,7 @@

###本程序依赖data目录下面的data.zip和dictionary.zip先解压缩 data 目录下面的 data.zip到当前目录。

* 新增说明3:增加基于 TF-IDF(词向量) 特征的文本分类程序。
### 新增说明3:增加基于 TF-IDF(词向量) 特征的文本分类程序。
1. 主程序:DfIdfClassifier.java
2. 效果如下:

@@ -17,7 +17,7 @@
+ 总共正确数 : 623
+ 总数:779

* 新增说明2:增加基于 N-Gram(词向量) 特征的文本分类程序,目的是找出自己领域相关的文本,然后再从这个领域相关的文本中判断正负面。
### 新增说明2:增加基于 N-Gram(词向量) 特征的文本分类程序,目的是找出自己领域相关的文本,然后再从这个领域相关的文本中判断正负面。

1. 测试语料:data/text_classification.zip 解压缩即可
2. 运行程序:NGramClassifier.java 即可。
@@ -31,7 +31,7 @@
+ government 271, 8
+ others 27, 473

* 新增说明1:2015-04-10测试了不用中文分词器,分词之后 LingPipe 情感分类的准确率,同时测试了去除停用词之后的情感分类的准确率。
### 新增说明1:2015-04-10测试了不用中文分词器,分词之后 LingPipe 情感分类的准确率,同时测试了去除停用词之后的情感分类的准确率。


1. 发现用HanLP的NLPTokenizer分词器,准确率最高,但是速度有点慢。


Loading…
Cancel
Save