# 在线预览 https://zjcqoo.github.io/-----https://www.google.com (由于访问量较大,目前限制 Referer 只允许从 GitHub 访问) # 安装 ```bash curl -O https://raw.githubusercontent.com/EtherDream/jsproxy/master/i.sh && bash i.sh ``` 如果安装失败,尝试[源码编译安装](docs/compile.md)。 # 测试 可通过如下命令,验证代理是否生效: ```bash curl http://服务器IP:8080/http \ -H '--url: https://raw.githubusercontent.com/EtherDream/jsproxy/master/test/works.txt' \ -H 'Origin: http://localhost' ``` 正常情况下,显示 `ok`。如果无法连接,检查 8080/8443 端口是否添加到防火墙。 其他错误,可尝试查看错误日志: ```bash cat /home/jsproxy/server/nginx/logs/error.log ``` # 维护 ```sh # 切换到 jsproxy 用户 su - jsproxy # 重启服务 ./run.sh reload # 关闭服务(参数和 nginx -s 相同) ./run.sh quit # 启动服务 ./run.sh # 查看代理日志 tail server/nginx/logs/proxy.log ``` 目前暂未实现开机自启动。 # 远程测试 如果服务器没有桌面环境无法使用浏览器,可尝试执行: ```sh curl http://服务器IP:8080/http \ -H 'Origin: http://localhost' \ -H '--url: https://www.baidu.com/' ``` 观察返回内容是否正常。 # 部署 ## 客户端 浏览器端项目位于:https://github.com/EtherDream/jsproxy-browser 准备一个域名(例如 `example.com`),参考备注,将其添加到线路地址。 > 注意:端口是 8443,不是 8080。因为 Service Worker 只有本地测试可用 HTTP 协议,其他场合必须 HTTPS。 编译脚本,将 `www` 目录发布到 Web 空间(例如 `https://myhost.github.io`) (目前还不完善,之后将实现动态配置,无需修改 JS 代码) ## 服务端 解析 `example.com` 到自己的服务器。给该域名申请证书,保存到 `cert/example.com/` 目录下。(可参考 `gen-cert` 目录,使用脚本自动生成) 修改 `nginx.conf` 中域名相关的配置(默认被注释)。 在 `allowed-sites.conf` 中添加一行 Web 空间的地址,例如: ``` https://myhost.github.io 'my'; ``` 重启服务。访问 `https://myhost.github.io` 预览。 # 安全策略 如果不希望代理访问内网,可执行 `setup-ipset.sh` 避免 SSRF 风险: ```bash /home/jsproxy/setup-ipset.sh ``` > 需要 root 权限,依赖 `ipset` 命令 该脚本可禁止 `jsporxy` 用户访问内网(针对 TCP)。nginx 之外的程序也生效,但不影响其他用户。 # 项目特点 相比传统在线代理,本项目具有以下特点: ## 服务端开销低 传统在线代理几乎都是在服务端替换 HTML/JS/CSS 等资源中的 URL。这不仅需要对内容做大量的分析和处理,还需对流量进行解压和再压缩,消耗大量 CPU 资源。并且由于逻辑较复杂,通常使用 Python/PHP 等编程语言自己实现。 为降低服务端开销,本项目使用浏览器的一个黑科技 —— Service Worker。它能让 JS 拦截网页产生的请求,并能自定义返回内容,相当于在浏览器内部实现一个反向代理。这使得绝大部分的内容处理都可以在浏览器上完成,服务器只需纯粹的转发流量。 因此本项目服务端直接使用 nginx,并且转发过程不修改内容(只修改 HTTP 头),避免了内容处理产生的巨大开销。同时得益于 nginx 丰富的功能,很多常用需求无需重新造轮子,通过简单配置即可实现。并且无论性能还是稳定性,都远高于自己实现。 ## API 虚拟化 传统在线代理大多只针对静态 URL 的替换,忽视了动态 URL 以及和 URL 相关的网页 API。例如 a.com 反向代理 google.com,但页面中 JS 读取 `document.domain` 得到的仍是 a.com。这可能导致某些业务逻辑出现问题。 为缓解这个问题,本代理在页面头部注入一个 JS,用以重写绝大部分和 URL 相关的 API,使得页面中的 JS 获取到的仍是原始 URL: ![](https://raw.githubusercontent.com/EtherDream/jsproxy-localtest/temp/hook.png) 对于有些无法重写的 API,例如 `location`,本代理会将代码中字面出现的 `location` 替换成 `__location`,从而将操作转移到自定义对象上。当然对于非字面的情况(例如 `this['lo' + 'cation']`),目前还无法处理。 ### 界面和接口分离 参见下文 # CHANGELOG ## v0.0.1 虽然目前仍为概念演示状态,但相比[最初版本](https://github.com/EtherDream/jsproxy/tree/first-ver),有了很大变化: ### 不再使用子域名 使用子域名编码目标域名(例如 gg.jsproxy.tk),存在太多缺陷。例如 HTTPS 证书问题,DNS 性能和安全问题等。因此目前不再使用子域名,只用固定的域名,目标 URL 放在路径里。例如: https://zjcqoo.github.io/-----https://www.google.com 当然这也会产生很多新问题,例如无法支持 Cookie、页面之间没有同源策略限制等。 对于 Cookie,目前通过 JS 来维护,而不用浏览器原生(当然还有不少细节没实现)。这样的好处是前后端可以分离,前端页面可以放在第三方 Web 服务器上(例如 CDN、GitHub Pages),我们的服务器只提供代理接口。 这样一个页面可使用多个服务器的代理接口,并能实现线路切换、负载均衡等效果。 同源策略方面的限制目前暂未实现,因此不要进行登陆等操作,避免隐私泄露。 ### 服务端优化 安全改进:由于 Web 页面托管在第三方站点上,自己的服务器无需开启 443 端口,因此也无需 root 运行。同时支持 IP 黑名单功能,防止 SSRF 攻击。 代码改进:接口代理使用固定的 URL(参见 `api.conf`),不再使用任意路径,代码干净了很多。 ## 支持更多浏览器 相比之前版本只支持 Chrome,现在还支持最新的 Safari 和 FireFox。 注意:FireFox 隐身模式下不支持 Service Worker,只能普通模式访问。 ### 提供一个首页 虽然依旧简陋,但比之前好。提供了线路切换、预加载的功能。 # 当前开发中的功能... ## 增加节点切换 目前尝试将服务器分为两种:高级(延时低、带宽小、费用高),低级(延时高、带宽大、费用低)。 浏览器首先访问高级服务器,如果返回的是静态资源且体积较大,服务器只返回资源属性(大小、修改时间、首块哈希等),浏览器随后通过低级服务器获取完整资源;如果获取到的属性和之前不一致(例如 IP 变化导致),再从高级服务器获取完整内容。 这样设计,是为了降低高级服务器的带宽和流量成本,同时充分利用廉价服务器的资源。 目前演示中的低级服务使用的是 ClodeFlare Worker,其费用为 100 万次请求 / $0.5,没有带宽和流量限制,但延时较大,适合于体积较大的资源代理;高级服务为阿里轻量云,延时相对较小,上行带宽和流量有限,但下行流量免费且带宽较大,因此合适较小资源的代理,及其较大资源的属性获取。 使用这种方案,理想情况下可以支撑上百人同时观看高清视频。(当然现实中不少视频网站会关联用户 IP,导致节点切换失败,最终仍走高级服务器,难以达到这个数值) 未来会尝试进一步细分请求的优先级。例如同样是获取视频的请求,不同的片段范围,其优先级是不同的。当首次打开或者拖动进度时,用户希望能尽快看到内容,这就需要更高的优先级;当视频缓冲足够时,这时延时和稳定性已不再重要,因此可以走更廉价的节点。 当然具体的实现细节目前仍在探索和优化中,本质意义自然是物尽其用。这是一个很有意思的话题,有兴趣的可以交流讨论。 # 类似项目 目前找到的都是传统后端替换 URL 的方案。当然后端替换也有不少优点,例如浏览器兼容性高,甚至低版本的 IE 都可以使用。 ## zmirror GitHub: https://github.com/aploium/zmirror ## php-proxy GitHub: https://github.com/jenssegers/php-proxy # 项目意义 本项目主要用于以下技术的研究: * 网站镜像 / 沙盒化 * 钓鱼网站检测技术 * 前端资源访问加速 当然请勿将本项目用于非法用途,否则后果自负。 Demo 页面文明使用,不要进行登陆等涉及隐私的操作。 # License MIT