前段时间研究了一下自动化工具Huginn,在本地进行了部署,一直没能跑通。但监控网页变化的方式不止一种。今天就来介绍下Chrome插件Web Monitor,还有一个RSS制作的工具Feed43。

浏览器监控插件Distill Web Monitor

Distill Web Monitor是Chrome上一个监控网页变化的插件。可以监控全页面或部分元素上的内容变化,监控间隔从5秒到N天自由设定。在提醒方式上,除了本地的浏览器弹出窗口提醒及图标上的数字变化外,还提供了电子邮件,以及短信的提醒方式(部分需要高级版才可享用)。在项目详细设置的页面,甚至可以设定当价格低于某个值时提醒。

简单教程:

  1. 打开需要监控的网页。
  2. 点击浏览器工具栏上的 Distill's 水滴图标。
  3. 根据您的需要选择 “部分页面” 或“监控整个页面”。选择部分页面时,把鼠标悬停在想要监控的网页区域,然后 “点击” 选择需要监控的部分页面。可以选择多个部分。
  4. 点击保存,大功告成!
  5. 点击 Distill 图标进入 监控列表,查看监控的网页列表。

示例用途:

监控京东上某个商品的价格和优惠信息。这里使用了正则表达式,目的是简化信息,只显示关键信息。规则如下:

  • 正则:
^(¥)?\d{2,4}\.\d{2}(?!元)|满\d+元{0,1}减\d+元{0,1}|满\d+件,总价打\d+(\.\d+)?折|每满\d+元,可减\d+元|¥\d{0,2}.\d{0,2}|赠品|有货|无货
  • 会员价 CSS 选择器:.itemInfo-wrap .p-price-plus .price
  • 普通价 CSS 选择器:.itemInfo-wrap .p-price .price
  • 优惠券 CSS 选择器:.quan-item
  • 活动信息 CSS 选择器:.J-prom
  • 粉丝价 CSS 选择器:.p-price-fans
  • 赠品 CSS 选择器:.J-prom-gift
  • 库存状态 CSS 选择器:.store-prompt

监控过程要用 Chrome 浏览器,所以你必须用电脑。也可以使用云端监控(免费 5 个),这样打开 Chrome 的时候就能收到提醒了。

RSS 定制

有些需要监控的内容,不是特别紧急,我们不希望它在工作的时候突然跳出来打扰。更建议使用RSS来监控。比如《权利的游戏》更新了之类的……

但问题来了,大部分网站已经不再提供RSS订阅服务,这时候就需要我们自己来制作一个RSS。除了自己码一个监控,更好的方式当然就是利用 Fees43 的RSS生成服务。

Feed43 在国内是没法顺利访问的,你需要懂一些科学方法。我个人很喜欢 RSS,从 2007 年开始用,中间有幸去了鲜果网工作,后来 Google Reader 停止服务,转到 Feedly 一直到现在。

具体的教程可以在网上搜索 Feed43,也可以看 这篇教程。生成的 RSS 内容比较有限,如果需要得到全文内容,可以使用 FeedEx 服务进行全文输出。

你需要懂一些Html的知识,不过不用担心,仅仅几条规则而已。附一些我自己制作的一些规则:

QuestMobile行业研究报告

  • Feed URL: https://feed43.com/7208524504271081.xml
  • 全文 URL:https://feedex.net/feed/feed43.com/7208524504271081.xml

中国政府数据说

  • Feed URL: https://feed43.com/3446885715685567.xml
  • 全文 URL:https://feedex.net/feed/feed43.com/3446885715685567.xml

亿欧智库研究报告

  • Feed URL: https://feed43.com/4865257434683335.xml
  • 全文 URL:直接输出PDF

多看经管类图书

  • Feed URL: https://feed43.com/4711718641114114.xml
  • 全文 URL:无需输出全文

天善智能免费课

  • Feed URL: https://feed43.com/5630740400287533.xml
  • 全文 URL:无需输出全文

数据局报告

  • Feed URL: https://feed43.com/5544317218176523.xml
  • 全文 URL:https://feedex.net/feed/feed43.com/5544317218176523.xml

极光大数据

  • Feed URL: https://feed43.com/2123614508207504.xml
  • 全文 URL:https://feedex.net/feed/feed43.com/2123614508207504.xml

海贼王漫画

  • Feed URL: https://feed43.com/8216742042416687.xml
  • 全文 URL:不需要输出全文

艾瑞产业研究洞察

  • Feed URL: https://feed43.com/6834308110480877.xml
  • 全文 URL:https://feedex.net/feed/feed43.com/6834308110480877.xml

TED 腾讯视频

  • Feed URL:https://feed43.com/7406454822715851.xml
  • 全文 URL:不需要输出全文

天善学院 菜鸟学 Python

  • Feed URL: http://feed43.com/6764501242735674.xml
  • 全文 URL:https://feedex.net/feed/feed43.com/6764501242735674.xml

Owwly:

  • Feed URL: http://feed43.com/8864310407767645.xml

百度 AI 开放平台新产品

  • Feed URL: http://feed43.com/7630075531541718.xml

阿里云数据智能

  • Feed URL: http://feed43.com/2867367418060262.xml

思考一个高阶玩法:可以用 RSS 监控 API 吗?