职位描述
【职位要求】
1.掌握 Python 语言基础,有 Python 编程经验者优先。
2.了解常用的爬虫框架,如 Scrapy、BeautifulSoup、Selenium 等,有实际项目经验者优先。
3.熟悉数据处理,熟悉Numpy/Pandas,Jieba等NLP库;
4.了解网络请求库,如 Requests、urllib 等,具备基本的 HTTP 协议和 RESTful API 设计原则知识。
5.熟悉网页解析和数据提取技术,如 XPath、CSS 选择器、正则表达式等。
6.具备基本的后端开发知识,了解至少一种后端开发框架,如 Flask、Django 等。
7.了解数据库技术,如 MySQL、MongoDB 等。
8.具备良好的学习和沟通能力,能够快速掌握新技术和知识。
9.熟悉使用git工具,能使用git进行版本管理,团队协作;
【工作职责】
1.协助开发和维护爬虫系统,从各种网站和数据源收集数据。
2.协助进行数据的清洗、整理和存储,确保数据的质量和准确性。
3.参与后端开发工作,支持整体项目的实施和维护。
4.与团队成员紧密协作,共同解决问题,达成项目目标。
5.持续学习新技术,提高自己的技能和能力。
工作地点
上海市/上海市/浦东新区 源深金融大厦 源深路355号306