| 程序包 | 说明 |
|---|---|
| com.hankcs.hanlp.mining.word2vec |
Java移植版的word2vec,最大程度上与原版一致。
|
| 限定符和类型 | 方法和说明 |
|---|---|
Vector |
Vector.add(Vector other) |
Vector |
DocVectorModel.addDocument(int id,
String content)
添加文档
|
Vector |
Vector.addToSelf(Vector other) |
Vector |
Vector.divideToSelf(float f) |
Vector |
Vector.divideToSelf(int n) |
Vector |
Vector.minus(Vector other) |
Vector |
Vector.normalize()
自身归一化
|
abstract Vector |
AbstractVectorModel.query(String query)
查询抽象文本对应的向量。
|
Vector |
DocVectorModel.query(String content)
将一个文档转为向量
|
Vector |
WordVectorModel.query(String query) |
Vector |
AbstractVectorModel.remove(K key)
删除元素
|
Vector |
AbstractVectorModel.vector(K key)
获取一个键的向量(键不会被预处理)
|
| 限定符和类型 | 方法和说明 |
|---|---|
Vector |
Vector.add(Vector other) |
Vector |
Vector.addToSelf(Vector other) |
float |
Vector.cosine(Vector other)
夹角的余弦
|
float |
Vector.cosineForUnitVector(Vector other)
夹角的余弦
认为this和other都是单位向量,所以方法内部没有除以两者的模。 |
float |
Vector.dot(Vector other) |
Vector |
Vector.minus(Vector other) |
List<Map.Entry<K,Float>> |
AbstractVectorModel.nearest(Vector vector)
获取与向量最相似的词语(默认10个)
|
List<Map.Entry<K,Float>> |
AbstractVectorModel.nearest(Vector vector,
int size)
获取与向量最相似的词语
|
| 构造器和说明 |
|---|
AbstractVectorModel(Map<K,Vector> storage) |
Copyright © 2014–2017 码农场. All rights reserved.