大事记

当前位置:首页   >  资讯文章   >  scrapy运行几种方式

scrapy运行几种方式

导读

crawl

  • 语法: scrapy crawl

  • 是否需要项目: yes

1.在cmd窗口执行

$ scrapy crawl myspider
[ ... myspider starts crawling ... ]


2.pycharm运行

   当你运行 scrapy command arg 这样的命令时,这里的 scrapy 实质是一个 python 脚本,它接受参数,调用 scrapy/cmdline.py 中的 execute() 函数.通过几下几步配置执行命令。

blob.png

blob.png

3.通过python脚本调用

这里主要通过scrapy.crawler.CrawlerProcess来实现在脚本里运行一个spider。 

# -*- coding: utf-8 -*-

from scrapy.crawler import CrawlerProcess
from scrapy.settings import Settings
#引用spider
from project.spiders.spider_name import spider_class

#配置setting,可自定义setting属性
settings = Settings() 

process = CrawlerProcess()

#执行spider
process.crawl(CtripSpider)
process.start()


4.通过CrawlerRunner运行一个spider

# -*- coding: utf-8 -*-

from twisted.internet import reactor
from scrapy.crawler import CrawlerRunner
from scrapy.settings import Settings
#引用spider
from project.spiders.spider_name import spider_class

#配置setting,可自定义setting属性
settings = Settings() 

#执行spider
runner = CrawlerRunner(settings)
runner.crawl(spider_class)
reactor.run()



扫码关注

网友评论

没有登录 不能评论,请注册用户

1.事件薄网站遵循《互联网新闻信息服务管理规定》, 不干预新闻舆论及牟取不正当利益。 2.网站资讯均来自网络,如有侵权,请联系我们。3.如果您认为本网站有帮助,请多多支持本站。

友情链接

汪汪宠物 |
事件薄