如何用scrapy 抓取js生成的页面？

0 0

有些页面通过诸如js的writeline生成，数据都是来自后台，在前台的“查看源代码”中无法看到。

像这些页面如果直接抓取，是行不通的。

通过在sf上查找，发现需要加scrapy的中间件，在分析之前，先要把js的内容解析出来。

网上说的比较多的是webkit，但都通通指向同一个内容：链接不一样，内容基本一样，而且说的比较简单，这里想请教大家，能不能说的具体一点？

11 years, 6 months ago

倉田サユリ 11 years, 6 months ago

尝试抓包获取数据api接口直接对api接口 scrapy 基本百发百中...
真不行再webkit模拟...

answered 11 years, 6 months ago

米修的哈士奇 answered 11 years, 6 months ago