不得不说java虽然复杂,但是Maven是真的很好
conda依赖管理一坨
今天学了文本处理方式和文本张量表示
a.文本处理主要是jieba分词器(模式,api),命名实体识别(七种),词性标注
b.文本张量化:文本数值化,数值张量化(torch.Tensor)
文本数值化:one-hot(简单割裂易溢出),word2vec(cbow,skipgram,以及fasttext)
不得不说java虽然复杂,但是Maven是真的很好
conda依赖管理一坨
今天学了文本处理方式和文本张量表示
a.文本处理主要是jieba分词器(模式,api),命名实体识别(七种),词性标注
b.文本张量化:文本数值化,数值张量化(torch.Tensor)
文本数值化:one-hot(简单割裂易溢出),word2vec(cbow,skipgram,以及fasttext)