S1全文RSS源(更新:能看图了!)



TL; DR
版面热帖rss源: http://caraba1st.com/fid-{版面ID}.xml 比如 http://caraba1st.com/fid-75.xml 就是外野的全文RSS
帖子追踪rss源:http://caraba1st.com/tid-{帖子ID}.xml 比如 http://caraba1st.com/tid-636427.xml 就是J20帖子的全文RSS
帖子的ID和版面的ID都可以通过地址栏获得。
外野: http://caraba1st.com/fid-75.xml漫区: http://caraba1st.com/fid-6.xml
八体:http://caraba1st.com/fid-77.xml
PC: http://caraba1st.com/fid-51.xml
对于想要只有标题,没有内容的rss源,可以在中间加上title-only
比如http://caraba1st.com/title-only/fid-75.xml 就是外野的标题rss源。
06-02:图片功能更新,效果如下


什么是RSS,什么是全文RSS?关于RSS的介绍可以看这个博客。RSS是一种信息聚合格式,博客作者或者新闻网站的站长以RSS的格式发布自己写的博客或者新闻,然后用户通过RSS的软件订阅这些RSS源。现在的今日头条属于RSS的进化(或者说退化)版本,相对于头条控制所有的频道,RSS能够更自由的添加和删除订阅频道。
RSS有两种,一种叫做摘要RSS,就是RSS的内容里面只有文章的一小部分内容,大部分内容都需要点到网页上才能查看。另一种叫做全文RSS,不需要点击rss的源网页就能查看,的全文RSS属于第二种,会显示帖子的所有内容。

这个RSS有什么用?

    摸鱼:终端的RSS阅读器很容易伪装成你在看代码/写程序,可以十分隐蔽的刷。推送:关注你想关注的帖子,等到有更新的时候就会给你推送新的帖子。聚合:版面的RSS会帮你聚合最热的帖子,节省你的看贴时间。自动化:IFTTT提供很多自动化的Applet,可以根据你的需要打造自己的流程。

    怎么订阅?
    手机版的话推荐Feedly&inoreader,命令行版本的话推荐newsboat

    为什么要做这个聚合?

    主要是想爬一点语料,做一个的Bot。同时顺带做了这个聚合的RSS源。

    之后的计划?
    关于RSS源相关的东西我感觉做的差不多了,需要修补的时候可以在这帖子里提意见。等到bot出来之后,做一个网页给**玩。






    网友评论:
    手机版推荐inoreader。

    多谢,加上了。
    tracker哥你转生啦

    —— 来自 HMD Global Nokia X7, Android 9上的 v2.1.2
    这个外野全文的rss还是不好用。昨天订阅一晚上,有100多篇新文章是AKB48专楼的更新,80篇新文章是创造101的更新。对于不追爱抖露的人来讲就是刷屏。要是订阅漫区的话估计全屏都是某女仆的真爱楼更新。

    最近外野加上护城河,自带的RSS也关了,楼主能不能做个替代品?@witness-s1

    我在想屏蔽那些大于20页的帖子,如何?

    这个思路应该可以解决长楼更新的霸屏。
    有个问题请教一下,评论数小于50的新帖是不是不会被放进去?


    我把长楼的更新限制到了最新的200个帖子,这样应该就不会刷屏了。
    这个更新是根据回帖速度来的,最近一个小时回帖最快的帖子就会放进去。如果帖子不满50楼,那么新的回复会出现在下一次的更新中。这要求RSS阅读器能够跟踪文章的更新,具体实现看你的RSS阅读器而定。
    另外,泥潭bot训练一天的结果:


    感觉还是有点意思的

    训练出了个巨魔,喷了
    话说不知道泥潭有些人看得到么,我就这一个小号也只会在这帖子里回帖。不要把所有人都想象成我的马甲好不好,我还没那么闲

    — from Google Pixel 3 XL, Android 9 of Next Goose v2.1.2
    有意思,持续观察

    可以生成一个只有标题的最新贴吗,帖子下的内容更新了也只显示一次的那种(类似原来官方的)

    —— 来自 Google Pixel 2, Android 9上的 v2.1.2

    话说只有标题的需求,需要实时么?我现在这个爬虫大概延时有一个小时。

    不需要实时的


    好用,多谢LZ!

    顺便问一下thunderbird 有办法显示图片吗
    多谢楼主,试试看


    这个能处理引用吗?
      畜男不是人:
      sheshiro 发表于 2019-06-02 07:21:02
      又是炸妹帖
      在我看来樱桃和那天佳木斯那个司机一样,没有过错但是让人不舒服而已
      而别人承认有些女的碰瓷, ...真是强行不舒服 不知道女粉丝多的公众号抽女**的时候有没有考虑过男人舒不舒服。
      -
    复制代码
    现在引用区域和正文混在一起,分不清哪些是引用那些是回复
    可以用>标记出引用区域吗
    求一个码农用win平台rss阅读器啊,摸鱼找不着门路是最难受的

    那弄好了,http://caraba1st.com/title-only/fid-75.xml 会显示前100个热贴

    原因是我没有把img标签变成带img的tag(懒得写regex
    今天处理完了 @灰色的夏天 的要求,等下有时间处理quote和图片

    楼上用Thunderbird看着不错,需要命令行版本么?

    多谢,突然想起foxmail也有rss订阅功能,不过用着是真难受啊

    本地的有newsflow

    多谢多谢!

    十分感谢!!
    为了隐蔽的摸鱼,你们怎么什么都懂
    楼主你这个爬虫权限多少

    最好是权限低一点的
    不然到时候地址外泄 高权限帖子也满世界乱飞了

    —— 来自 HUAWEI MHA-AL00, Android 8.0.0上的 v2.1.2

    40,现在权限不是很高的。而且rss那么难用,很难推广开


    现在已经支持看帖子里的图片了,目前来源于s1的图片不支持,任何外链图床都支持。

    效果:

    您真是太棒了!
    这个有点意思,建议深入开发

      -
    好评如潮。
    不过那个bot真是笑死。
    没文史区的吗

    想要的话可以加入~对我来说就改两行代码的事情



    还没,现在绝大部分的回复还不能看(都在回复:我觉得不错),我在想可能半年之后相关的系统会成熟一点。目前是用allennlp做的LSTM模型。

    爬虫用的号因为频繁抓数据导致二十四小时在线,在线时间和权限会越来越高的吧,如果权限超70是不是应该换个号?

标签: 看图   发布日期:06-22