nlp01.

不得不说java虽然复杂,但是Maven是真的很好

conda依赖管理一坨

今天学了文本处理方式和文本张量表示

a.文本处理主要是jieba分词器(模式,api),命名实体识别(七种),词性标注

b.文本张量化:文本数值化,数值张量化(torch.Tensor)

文本数值化:one-hot(简单割裂易溢出),word2vec(cbow,skipgram,以及fasttext)

 

 

 

发表评论