技术解放双手——使用爬虫爬取FC2的资源

喀秋莎 2021-10-13 8159

引自:分享一个自己写的FC2资源爬虫小工具

作用:
用于搜索最近已有的fc2磁链资源并形成网页列表的傻瓜式小工具,方便自行选择下载
思路:
fc2和nyaa站这两个宝地,资源多,品种丰富,但是nyaa站的资源大多都没放预览图而且很多资源有重复传种,想要找个心仪的资源还得逐个翻番号去官网看,不太方便。于是写了这么个小工具。自动爬取nyaa站fc2搜索词下的前n页资源,然后用资源的番号去官网对应页面下载预览图,最后本地生成个网页,方便自行检索。写完后给几个兄弟试用了下,感觉还行,今天bus站又刚好能发帖了,于是顺手分享一下。

PS:这个工具,不需要编程基础,不需要自建网站后台,生成和获取的数据都是到手可用的。但是得自备梯子。

使用方法(仅适合windows 10环境,win7需要自行安装环境包):

1.下载FC2freelistver1.3.zip.001和FC2freelist ver1.3.zip.002并解压缩到任意位置

得到上面这一堆东西,主要的就是标红框的文件,几个py结尾的是源代码,如果不需要可以删除

2.在config.ini选择是否代理及是否下载预览原图(选填,不更改将使用默认配置运行)
双击用记事本打开config.ini文件,把文件中的红框1,2改成自己爬墙软件的代理端口,如果不知道,可以试下把红框3的内容改成no,爬墙软件的代理模式改为全局


3.双击FC2freelist.exe→输入3,回车→等待爬虫程序爬完所需资源(速度快慢由您的网络环境决定)
 
4.打开home.html→选择文件(./data/FC2_ALL.xlsx)→enjoy

2021.10.11 :修改config.ini后仍无法识别的bug已经修复,重新下载即可

闲里做出来的小工具,基本满足自己的需求,之后就应该不怎么会更新了。整个工程的无后端版源代码都已经放出来了,如果各位大佬有需要可以自行新增修改代码哈,无需授权和转载的。

下载地址:https://github.com/FOOLISHcode/FC2-FREE-list

感悟:喀秋莎的技术能力只有GHS时才有突飞猛进。
我在上班,别发骚图了。
最新回复 (1)
  • 喀秋莎 2021-10-14
    0 2
    Roogle NB,不过最好是番号和封面图直接对应,存入数据库,然后下次检索就更方便了
    那个home.html实现的就是这个功能。
    我在上班,别发骚图了。
    • ACG里世界
      3
          
返回
发新帖