職位描述
該職位信息待核驗,請仔細了解后再進行投遞!
職責描述
1、參與數據采集系統的開發
2、負責網頁信息和APP數據抽取、清洗、消重等工作,提升平臺的抓取效率和質量;
3、公司大數據平臺算法編碼和spark優化
4、大數據平臺維護
5、與產品部門和上級溝通確保數據的準確性及時性
6、參與公司教學任務(Python Java)。
任職要求:
1. 大學本科及以上學歷
2. 至少1-3年以上數據采集和數據分析經驗;
3. 掌握Spark,有scala或python開發spark分析程序的經驗;
4. 熟練掌握html、css、xpath、正則表達式、scrapy、selenium、playwright、requests、pandas;
5. 熟悉scala、python等編程語言。
6. 熟悉常見的反爬策略(驗證碼識別,IP代理池、應用Ip池、headers認證和cookie等),有一定的研究和解決問題的能力,有一定的逆向能力。
7. 了解大數據生態體系,熟悉hadoop和spark。
8. 熟練使用Python pandas等類庫進行數據清洗和分析;
9. 熟悉MongoDB, Redis, MySQL等工具的基本操作。
10. 熟練使用Python,Shell,Git、SVN版本控制,熟悉Linux開發環境。
11.會Java技術優先。
工作地點
地址:成都郫都區成都四川省成都市郫都區德源鎮大禹東路66號
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
HR
四川華迪信息技術有限公司
-
IT服務·系統集成
-
200-499人
-
公司性質未知
-
成都市高新西區西區大道1808號

應屆畢業生
本科
2026-03-03 23:23:09
514人關注
注:聯系我時,請說是在四川人才網上看到的。
