InfoSpider(爬虫工具箱),旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明,并提供数据分析功能,基于用户数据生成图表文件,使得用户更直观、深入了解自己的信息,需要通过各种库来进行软件的安装!
软件介绍
INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。并提供数据分析功能,基于用户数据生成图表文件,使得用户更直观、深入了解自己的信息。 目前支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源中国博客、简书。
功能介绍
安全可靠:本项目为开源项目,代码简洁,所有源码可见,本地运行,安全可靠。
使用简单:提供 GUI 界面,只需点击所需获取的数据源并根据提示操作即可。
结构清晰:本项目的所有数据源相互独立,可移植性高,所有爬虫脚本在项目的 Spiders 文件下。
数据源丰富:本项目目前支持多达24+个数据源,持续更新。
数据格式统一:爬取的所有数据都将存储为json格式,方便后期数据分析。
个人数据丰富:本项目将尽可能多地为你爬取个人数据,后期数据处理可根据需要删减。
数据分析:本项目提供个人数据的可视化分析,目前仅部分支持。
文档丰富:本项目包含完整全面的使用说明文档和视频教程
使用说明
依赖安装
安装python3和Chrome浏览器
安装与Chrome浏览器相同版本的驱动
安装依赖库 pip install -r requirements.txt
工具运行
进入 tools 目录
运行 python3 main.py
在打开的窗口点击数据源按钮, 根据提示选择数据保存路径
弹出的浏览器输入用户密码后会自动开始爬取数据, 爬取完成浏览器会自动关闭.
在对应的目录下可以查看下载下来的数据(xxx.json), 数据分析图表(xxx.html)
123PDFtoImage是一款专为pdf文件与图片制作的转换器工具。这款工具可以轻松的帮助用户进行将PDF页面导出到BMP,JPEG,JPG,GIF,PNG,WMF,EMF,有需要的用户赶快来下载试试吧!
Microsoft Edge(微软Chromium内核浏览器),MicrosoftEdge微软Chromium内核浏览器是微软结合了谷歌Chromium内核开发的全新MicrosoftEdge版浏览器,用户朋友使用这款中文版Chromium版Edge浏览器可以体验到不一样的浏览速度和操作模式,您可以免费下载。
随机数生成专家即随机数设计专家,是一款帮助用户轻松便利地生成随机数的杂类工具,用户能够通过软件设计随机数参数,更有多种模式供用户选择,如列举模式、图片模式甚至多元一次
PRemoteM(远程桌面管理器)是一款现代的远程会话管理和启动器,它让你能够在任何时候快速开启一个远程会话,目前 PRemoteM已支持微软远程桌面(RDP)、VNC、SSH、Telnet、SFTP, FTP, RemoteApp等协议。
风之影浏览器是一个高速智能而且功能强大的免费浏览器。风之影浏览器使用Blink渲染引擎,建立于开源的Chromium项目之上。风之影集成了诸多强大而且方便的功能帮助用户提高在线工作的效率和娱乐的体验。
百度浏览器的使命是让人们更流畅的上网、更愉悦的在线生活。通过百度的开放整合和精准识别,您可以一键触达海量优质的服务和资源,音乐、阅读、视频、游戏等个性所求得到全面贴心的满足。百度浏览器,带您进入美好互联网世界。