网络爬虫,数据挖掘
职位描述:
岗位职责:
1. 网络爬虫,对文本进行内容对象识别与分类,建立分类系统
2. 文本主题分析、语义分析,关键字提取与标注
3. 用户画像,行为分析、关联分析,建立评价模型
4. 数据挖掘算法研发与改进
任职要求:
1. 计算机、机器学习、自然语言处理、模式识别等相关方向本科及以上学历;
2. 至少熟练掌握Java、Python其中一门编程语言;
3. 熟悉自然语言处理算法,如word2vec、CRF、LDA、SVD等;
4. 熟悉机器学习常用的分类、聚类、回归模型和优化算法;
5. 熟悉自然语言处理中的文本挖掘、分词、语义分析、词性标注、主体模型、
相关性挖掘等具体原理和实现过程;
6. 熟悉常用的统计分析挖掘工具及机器学习框架算法包;
7. 有自然语言处理相关工作经验者优先。