| 限定符和类型 | 方法和说明 |
|---|---|
void |
DictionaryMaker.add(IWord word)
向词典中加入一个词语
|
void |
NGramDictionaryMaker.addPair(IWord first,
IWord second) |
Item |
DictionaryMaker.get(IWord word) |
| 限定符和类型 | 方法和说明 |
|---|---|
protected void |
NSDictionaryMaker.addToDictionary(List<List<IWord>> sentenceList) |
protected void |
NRDictionaryMaker.addToDictionary(List<List<IWord>> sentenceList) |
protected void |
NTDictionaryMaker.addToDictionary(List<List<IWord>> sentenceList) |
protected void |
NatureDictionaryMaker.addToDictionary(List<List<IWord>> sentenceList) |
protected abstract void |
CommonDictionaryMaker.addToDictionary(List<List<IWord>> sentenceList)
加入到词典中,允许子类自定义过滤等等,这样比较灵活
|
void |
CommonDictionaryMaker.compute(List<List<IWord>> sentenceList)
处理语料,准备词典
|
protected void |
NSDictionaryMaker.roleTag(List<List<IWord>> sentenceList) |
protected void |
NRDictionaryMaker.roleTag(List<List<IWord>> sentenceList) |
protected void |
NTDictionaryMaker.roleTag(List<List<IWord>> sentenceList) |
protected void |
NatureDictionaryMaker.roleTag(List<List<IWord>> sentenceList) |
protected abstract void |
CommonDictionaryMaker.roleTag(List<List<IWord>> sentenceList)
角色标注,如果子类要进行label的调整或增加新的首尾等等,可以在此进行
|
| 限定符和类型 | 方法和说明 |
|---|---|
static List<List<IWord>> |
CorpusLoader.convert2SentenceList(String path) |
List<List<IWord>> |
Document.getComplexSentenceList()
获取复杂句子列表,句子中的每个单词有可能是复合词,有可能是简单词
|
List<IWord> |
Document.getWordList()
获取单词序列
|
static List<List<IWord>> |
CorpusLoader.loadSentenceList(String path) |
| 限定符和类型 | 方法和说明 |
|---|---|
static boolean |
CorpusLoader.saveSentenceList(List<List<IWord>> sentenceList,
String path) |
| 限定符和类型 | 字段和说明 |
|---|---|
List<IWord> |
Sentence.wordList
词语列表(复合或简单单词的列表)
|
| 限定符和类型 | 方法和说明 |
|---|---|
Iterator<IWord> |
Sentence.iterator() |
| 构造器和说明 |
|---|
Sentence(List<IWord> wordList) |
| 限定符和类型 | 类和说明 |
|---|---|
class |
CompoundWord
复合词,由两个或以上的word构成
|
class |
Word
一个单词
|
| 限定符和类型 | 方法和说明 |
|---|---|
static IWord |
WordFactory.create(String param)
根据参数字符串产生对应的词语
|
| 限定符和类型 | 方法和说明 |
|---|---|
static IWord |
CorpusUtil.compile(IWord word)
编译单词
|
| 限定符和类型 | 方法和说明 |
|---|---|
static List<List<IWord>> |
CorpusUtil.convert2CompatibleList(List<List<Word>> simpleSentenceList)
将word列表转为兼容的IWord列表
|
static List<IWord> |
CorpusUtil.spilt(List<IWord> wordList) |
| 限定符和类型 | 方法和说明 |
|---|---|
static Word |
Precompiler.compile(IWord word) |
static IWord |
CorpusUtil.compile(IWord word)
编译单词
|
| 限定符和类型 | 方法和说明 |
|---|---|
static void |
Precompiler.compileWithoutNS(List<IWord> wordList)
在忽略ns的前提下预编译
|
static void |
Precompiler.compileWithoutNT(List<IWord> wordList)
在忽略ns的前提下预编译
|
static List<IWord> |
CorpusUtil.spilt(List<IWord> wordList) |
Copyright © 2014–2017 码农场. All rights reserved.