程序包com.hankcs.hanlp.mining.cluster的说明
文本聚类模块(k-means和repeated bisection)
参考文献 Steinbach M, Karypis G, Kumar V. A comparison of document clustering techniques[C]//KDD workshop on text mining. 2000, 400(1): 525-526.
实现上参考了 https://github.com/fujimizu/bayon 的C++代码。