职位要求
岗位要求: 1、负责相关的数据的抓取和清洗工作; 2、参与RPA数据处理平台的研发; 3、专注于垂直领域数据爬取,进行多平台信息的抓取和分析; 4、负责公司社保相关产品的应用开发和功能实现; 技能要求: 1、熟悉 Python 语言,熟悉常用数据结构、算法,熟练使用常用库,能快速准确的写出代码实现任务 2、熟悉TCP/IP、HTTP、HTTPS等网络协议,熟悉web前端,可读懂js/css/html等代码 3、熟练使用selenium,lxml,bs4对xml,html的文本进行抓取解析清理; 4、熟悉正则表达式,Jsoup、XPATH,CSS选择器,能够从结构化和非机构化的数据中获取信息,了解各种Web前端技术,包括HTML、XML、JavaScript、AJAX、JSON等; 6、掌握Python基础开发,熟悉Tornado、Django、Flask其中任一web框架,熟悉常用的基础网络和解析类库; 7、熟悉 MySQL、Redis 等常见数据库和缓存 8、基础系统运维能力,熟悉linux平台,了解docker,有一定的python运维经验者优先 9、有自然语言处理经验、了解数据挖掘机器学习者优先;数学、统计学专业毕业者优先。