| 程序包 | 说明 |
|---|---|
| com.hankcs.hanlp.corpus.document | |
| com.hankcs.hanlp.corpus.document.sentence.word | |
| com.hankcs.hanlp.corpus.util | |
| com.hankcs.hanlp.model.trigram |
| 限定符和类型 | 方法和说明 |
|---|---|
static List<List<Word>> |
CorpusLoader.convert2SimpleSentenceList(String path) |
List<List<Word>> |
Document.getSimpleSentenceList()
获取简单的句子列表,其中复合词会被拆分为简单词
|
List<List<Word>> |
Document.getSimpleSentenceList(boolean spilt)
获取简单的句子列表
|
List<List<Word>> |
Document.getSimpleSentenceList(Set<String> labelSet)
获取简单的句子列表,其中复合词的标签如果是set中指定的话会被拆分为简单词
|
List<Word> |
Document.getSimpleWordList() |
| 限定符和类型 | 字段和说明 |
|---|---|
List<Word> |
CompoundWord.innerList
由这些词复合而来
|
| 限定符和类型 | 方法和说明 |
|---|---|
static Word |
Word.create(String param)
通过参数构造一个单词
|
Word |
CompoundWord.toWord()
转换为一个简单词
|
| 限定符和类型 | 方法和说明 |
|---|---|
Iterator<Word> |
CompoundWord.iterator() |
| 构造器和说明 |
|---|
CompoundWord(List<Word> innerList,
String label) |
| 限定符和类型 | 方法和说明 |
|---|---|
static Word |
Precompiler.compile(IWord word) |
static Word |
Precompiler.compile(Word word)
将一个单词编译为等效字串
|
| 限定符和类型 | 方法和说明 |
|---|---|
static Word |
Precompiler.compile(Word word)
将一个单词编译为等效字串
|
| 限定符和类型 | 方法和说明 |
|---|---|
static List<List<IWord>> |
CorpusUtil.convert2CompatibleList(List<List<Word>> simpleSentenceList)
将word列表转为兼容的IWord列表
|
| 限定符和类型 | 方法和说明 |
|---|---|
void |
CharacterBasedGenerativeModel.learn(List<Word> wordList)
让模型观测一个句子
|
Copyright © 2014–2018 码农场. All rights reserved.