如何用scrapy 抓取js生成的页面?


有些页面通过诸如js的writeline生成,数据都是来自后台,在前台的“查看源代码”中无法看到。

像这些页面如果直接抓取,是行不通的。

通过在sf上查找,发现需要加scrapy的中间件,在分析之前,先要把js的内容解析出来。

网上说的比较多的是webkit,但都通通指向同一个内容: 链接不一样,内容基本一样 ,而且说的比较简单,这里想请教大家,能不能说的具体一点?

scrapy JavaScript

倉田サユリ 11 years, 6 months ago

尝试抓包获取数据api接口 直接对api接口 scrapy 基本百发百中...
真不行再webkit模拟...

米修的哈士奇 answered 11 years, 6 months ago

Your Answer