| 程序包 | 说明 |
|---|---|
| com.hankcs.hanlp.dictionary.stopword | |
| com.hankcs.hanlp.tokenizer |
一些常用的配置好的静态分词器,其中一些具备特殊的预处理功能
可供用户参考以实现自己的预处理逻辑. |
| 限定符和类型 | 类和说明 |
|---|---|
class |
StopWordDictionary |
| 限定符和类型 | 字段和说明 |
|---|---|
static Filter |
CoreStopWordDictionary.FILTER
核心停用词典的核心过滤器,词性属于名词、动词、副词、形容词,并且不在停用词表中才不会被过滤
|
| 限定符和类型 | 方法和说明 |
|---|---|
static List<List<Term>> |
NotionalTokenizer.seg2sentence(String text,
Filter... filterArrayChain)
切分为句子形式
|
Copyright © 2014–2017 码农场. All rights reserved.