python入门之Scrapy shell的使用

2022-12-10 10:27 开发作者：码农飞哥

前言：

我们想要在爬虫中使用xpath、beautifulsoup、正则表达式，css选择器等来提取想要的数据，但是因为scrapy是一个比较重的框架，每次运行都要等到一段时间，因此要去验证我们提取规则是否正确，是一个编程客栈比较麻烦的事情，因此，scrapy提供了一个shell。用来方便的测试规则，当然也不仅仅局限于这一个功能。

打开Scrapy shell：

进入命令行终端，进入到scrapy项目所在的目录，然后进入到scrapy框架所在的虚拟环编程客栈境中，输入命令 scrapy shell [链接] ，就会进入到scrapy的shell环境中。在这个环境中，你可以跟在爬虫的parse方法中一样使用了。

进入到scrapy项目所在的目录：

cd /Volumes/development/python_learn/PycharmProjects/scrapy_demo/bmw_img_demhttp://www.cppcns.como/

进入到scrapy框架所在的虚拟环境中：

source /Volumes/development/Python_learn/PycharmProjects/编程客栈venv/crawler_evn/bin/activate

输入命令 scrapy shell [链接] :

rapy shell https://car.autohome.com.cn/pic/series/66.html

python入门之Scrapy shell的使用

输入我们需要测试的语句：

   srcs = response.xpath('//div[contains(@clxgSxmqyass,"uibox-con")]/ul/li/a/img/@src').getall()

python入门之Scrapy shell的使用

到此这篇关于python入门之Scrapy shell的使用的文章就介绍到这了,更多相关Scrapy shell的使用内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

继续阅读：python入门 Scrapy shell的使用

python入门之Scrapy shell的使用

更多精彩内容

精彩评论

最新开发

Django get_or_create方法的具体使用

python中Poetry包管理工具详解

Django中get()与filter()的区别及常见错误

通过Python实现动态获取用户桌面路径

Python中Literal 类型的具体使用

开发排行榜

springboot后端存储富文本内容的思路与步骤(含图片内容)

PyCharm运行python测试,报错“没有发现测试”/“空套件”的解决

return base64.b64encode(b).decode(

基于C语言实现钻石棋游戏的示例代码

Sublime Text 3解决中文乱码问题（实测可用）