Skip to content

hezhen/spider-course-4

Repository files navigation

spider-course-4

Spider course 4 sample, Python 3.6

weibo

利用微博的 API 来抓取微博的代码

multithread

多线程抓取

multi-process

多进程抓取,利用数据库来做任务队列

mafengwo

利用分布式的方式抓取马蜂窝,包括了控制台、通信协议栈demo

lxml

lxml 的demo

headless-chrome

用 Selenium + Chrome 的方式,抓取动态网页微博,安装方法在文件夹里有

About

Spider course 4 sample, Python 3.6

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages