您现在的位置 > 首页>科技资讯 >

S1全文RSS源(更新:能看图了!)

点击图片查看下一页
查看原图
更新:2019-06-22     编辑:     来源:    


  • TL; DR
    版面热帖rss源: http://caraba1st.com/fid-{版面ID}.xml 比如 http://caraba1st.com/fid-75.xml 就是外野的全文RSS
    帖子追踪rss源:http://caraba1st.com/tid-{帖子ID}.xml 比如 http://caraba1st.com/tid-636427.xml 就是J20帖子的全文RSS
    帖子的ID和版面的ID都可以通过地址栏获得。
    外野: http://caraba1st.com/fid-75.xml漫区: http://caraba1st.com/fid-6.xml
    八体:http://caraba1st.com/fid-77.xml
    PC: http://caraba1st.com/fid-51.xml
    对于想要只有标题,没有内容的rss源,可以在中间加上title-only
    比如http://caraba1st.com/title-only/fid-75.xml 就是外野的标题rss源。
    06-02:图片功能更新,效果如下


    什么是RSS,什么是全文RSS?关于RSS的介绍可以看这个博客。RSS是一种信息聚合格式,博客作者或者新闻网站的站长以RSS的格式发布自己写的博客或者新闻,然后用户通过RSS的软件订阅这些RSS源。现在的今日头条属于RSS的进化(或者说退化)版本,相对于头条控制所有的频道,RSS能够更自由的添加和删除订阅频道。
    RSS有两种,一种叫做摘要RSS,就是RSS的内容里面只有文章的一小部分内容,大部分内容都需要点到网页上才能查看。另一种叫做全文RSS,不需要点击rss的源网页就能查看,的全文RSS属于第二种,会显示帖子的所有内容。

    这个RSS有什么用?

      摸鱼:终端的RSS阅读器很容易伪装成你在看代码/写程序,可以十分隐蔽的刷。推送:关注你想关注的帖子,等到有更新的时候就会给你推送新的帖子。聚合:版面的RSS会帮你聚合最热的帖子,节省你的看贴时间。自动化:IFTTT提供很多自动化的Applet,可以根据你的需要打造自己的流程。

      怎么订阅?
      手机版的话推荐Feedly&inoreader,命令行版本的话推荐newsboat

      为什么要做这个聚合?

      主要是想爬一点语料,做一个的Bot。同时顺带做了这个聚合的RSS源。

      之后的计划?
      关于RSS源相关的东西我感觉做的差不多了,需要修补的时候可以在这帖子里提意见。等到bot出来之后,做一个网页给**玩。






      网友评论:
      手机版推荐inoreader。

      多谢,加上了。
      tracker哥你转生啦

      —— 来自 HMD Global Nokia X7, Android 9上的 v2.1.2
      这个外野全文的rss还是不好用。昨天订阅一晚上,有100多篇新文章是AKB48专楼的更新,80篇新文章是创造101的更新。对于不追爱抖露的人来讲就是刷屏。要是订阅漫区的话估计全屏都是某女仆的真爱楼更新。

      最近外野加上护城河,自带的RSS也关了,楼主能不能做个替代品?@witness-s1

      我在想屏蔽那些大于20页的帖子,如何?

      这个思路应该可以解决长楼更新的霸屏。
      有个问题请教一下,评论数小于50的新帖是不是不会被放进去?


      我把长楼的更新限制到了最新的200个帖子,这样应该就不会刷屏了。
      这个更新是根据回帖速度来的,最近一个小时回帖最快的帖子就会放进去。如果帖子不满50楼,那么新的回复会出现在下一次的更新中。这要求RSS阅读器能够跟踪文章的更新,具体实现看你的RSS阅读器而定。
      另外,泥潭bot训练一天的结果:


      感觉还是有点意思的

      训练出了个巨魔,喷了
      话说不知道泥潭有些人看得到么,我就这一个小号也只会在这帖子里回帖。不要把所有人都想象成我的马甲好不好,我还没那么闲

      — from Google Pixel 3 XL, Android 9 of Next Goose v2.1.2
      有意思,持续观察

      可以生成一个只有标题的最新贴吗,帖子下的内容更新了也只显示一次的那种(类似原来官方的)

      —— 来自 Google Pixel 2, Android 9上的 v2.1.2

      话说只有标题的需求,需要实时么?我现在这个爬虫大概延时有一个小时。

      不需要实时的


      好用,多谢LZ!

      顺便问一下thunderbird 有办法显示图片吗
      多谢楼主,试试看


      这个能处理引用吗?
        畜男不是人:
        sheshiro 发表于 2019-06-02 07:21:02
        又是炸妹帖
        在我看来樱桃和那天佳木斯那个司机一样,没有过错但是让人不舒服而已
        而别人承认有些女的碰瓷, ...真是强行不舒服 不知道女粉丝多的公众号抽女**的时候有没有考虑过男人舒不舒服。
        -
      复制代码
      现在引用区域和正文混在一起,分不清哪些是引用那些是回复
      可以用>标记出引用区域吗
      求一个码农用win平台rss阅读器啊,摸鱼找不着门路是最难受的

      那弄好了,http://caraba1st.com/title-only/fid-75.xml 会显示前100个热贴

      原因是我没有把img标签变成带img的tag(懒得写regex
      今天处理完了 @灰色的夏天 的要求,等下有时间处理quote和图片

      楼上用Thunderbird看着不错,需要命令行版本么?

      多谢,突然想起foxmail也有rss订阅功能,不过用着是真难受啊

      本地的有newsflow

      多谢多谢!

      十分感谢!!
      为了隐蔽的摸鱼,你们怎么什么都懂
      楼主你这个爬虫权限多少

      最好是权限低一点的
      不然到时候地址外泄 高权限帖子也满世界乱飞了

      —— 来自 HUAWEI MHA-AL00, Android 8.0.0上的 v2.1.2

      40,现在权限不是很高的。而且rss那么难用,很难推广开


      现在已经支持看帖子里的图片了,目前来源于s1的图片不支持,任何外链图床都支持。

      效果:

      您真是太棒了!
      这个有点意思,建议深入开发

        -
      好评如潮。
      不过那个bot真是笑死。
      没文史区的吗

      想要的话可以加入~对我来说就改两行代码的事情



      还没,现在绝大部分的回复还不能看(都在回复:我觉得不错),我在想可能半年之后相关的系统会成熟一点。目前是用allennlp做的LSTM模型。

      爬虫用的号因为频繁抓数据导致二十四小时在线,在线时间和权限会越来越高的吧,如果权限超70是不是应该换个号?

相关推荐

精彩图集

一品图片网部分图片资源收集于互联网,如果侵犯了您的版权请来信告知,我们会及时处理和回复,邮件地址:
© 2021 一品图片网 版权所有 苏ICP备150288886号 | sitemap | 图片大全