2019-03-04 04:47:46 +00:00
|
|
|
|
# 在线预览
|
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
https://zjcqoo.github.io/-----https://www.google.com
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
|
|
|
|
(目前仍在更新中,最好使用隐身模式访问,避免缓存导致的问题)
|
|
|
|
|
|
2019-05-10 05:08:14 +00:00
|
|
|
|
[之前版本](https://github.com/EtherDream/jsproxy/tree/first-ver)已不再更新。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
# 安装
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-05-10 05:08:14 +00:00
|
|
|
|
新建一个 `jsproxy:nobody` 用户,在其主目录安装 nginx:
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
```bash
|
2019-05-04 13:47:08 +00:00
|
|
|
|
groupadd nobody
|
|
|
|
|
useradd jsproxy -g nobody --create-home
|
2019-04-23 04:14:27 +00:00
|
|
|
|
su jsproxy
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
cd ~
|
2019-04-23 04:18:45 +00:00
|
|
|
|
git clone --depth=1 https://github.com/EtherDream/jsproxy.git server
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
cd server
|
|
|
|
|
./setup-nginx.sh
|
|
|
|
|
```
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
安装过程若有依赖缺失,可尝试(CentOS 为例):
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
|
|
|
|
```bash
|
2019-04-23 04:14:27 +00:00
|
|
|
|
yum install -y \
|
|
|
|
|
gcc gcc-c++ \
|
|
|
|
|
pcre pcre-devel \
|
|
|
|
|
openssl openssl-devel \
|
|
|
|
|
zlib zlib-devel
|
2019-03-04 04:47:46 +00:00
|
|
|
|
```
|
|
|
|
|
|
2019-04-29 09:52:50 +00:00
|
|
|
|
> nginx 最终安装在 `/home/jsproxy/openresty` 下,不会和系统已有的冲突。
|
|
|
|
|
|
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
## 测试
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
启动服务:
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
```bash
|
2019-04-23 05:00:31 +00:00
|
|
|
|
~/server/run.sh
|
2019-03-04 04:47:46 +00:00
|
|
|
|
```
|
|
|
|
|
|
2019-05-13 07:00:06 +00:00
|
|
|
|
访问:https://zjcqoo.github.io/#local (本地测试节点)
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
![](https://raw.githubusercontent.com/EtherDream/jsproxy-localtest/temp/preview.png)
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-05-13 07:00:06 +00:00
|
|
|
|
> 如果一直显示加载中,可尝试修改 `nginx.conf` 中 DNS 配置。(默认为 `1.1.1.1`,有些地区很慢)
|
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
注意,**当前项目只提供接口服务**,浏览器端脚本和页面不在本项目。这样做是为了让接口和界面分离,意义参见后续。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
# 部署
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-26 03:15:48 +00:00
|
|
|
|
## 客户端
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
浏览器端项目位于:https://github.com/EtherDream/jsproxy-browser
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-26 03:25:47 +00:00
|
|
|
|
准备一个域名(例如 `example.com`),参考备注,将其添加到线路地址。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-26 03:15:48 +00:00
|
|
|
|
> 注意:端口是 8443,不是 8080。因为 Service Worker 只有本地测试可用 HTTP 协议,其他场合必须 HTTPS。
|
|
|
|
|
|
2019-04-26 03:25:47 +00:00
|
|
|
|
编译脚本,将 `www` 目录发布到 Web 空间(例如 `https://myhost.github.io`)
|
2019-04-25 09:05:21 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
(目前还不完善,之后将实现动态配置,无需修改 JS 代码)
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
|
|
|
|
|
2019-04-26 03:15:48 +00:00
|
|
|
|
## 服务端
|
|
|
|
|
|
2019-04-26 03:25:47 +00:00
|
|
|
|
解析 `example.com` 到自己的服务器。给该域名申请证书,保存到 `cert/example.com/` 目录下。(可参考 `gen-cert` 目录,使用脚本自动生成)
|
2019-04-26 03:15:48 +00:00
|
|
|
|
|
|
|
|
|
修改 `nginx.conf` 中域名相关的配置(默认被注释)。
|
|
|
|
|
|
2019-04-26 05:06:19 +00:00
|
|
|
|
在 `allowed-sites.conf` 中添加一行 Web 空间的地址,例如:
|
2019-04-26 05:02:28 +00:00
|
|
|
|
|
|
|
|
|
```
|
2019-04-26 05:03:30 +00:00
|
|
|
|
https://myhost.github.io 'my';
|
2019-04-26 05:02:28 +00:00
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
重启服务。访问 `https://myhost.github.io` 预览。
|
2019-04-26 03:15:48 +00:00
|
|
|
|
|
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
# 安全策略
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
如果不希望代理访问内网,可执行 `setup-ipset.sh`,避免 SSRF 风险。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
该脚本可禁止 `jsporxy` 用户访问内网(针对 TCP)。nginx 之外的程序也生效,但不影响其他用户。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
# 服务管理
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
重启服务:`./run.sh reload`
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
关闭服务:`./run.sh quit`
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
参数和 nginx -s 相同。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
|
|
|
|
|
2019-04-30 03:10:48 +00:00
|
|
|
|
# 项目特点
|
2019-04-30 02:52:09 +00:00
|
|
|
|
|
|
|
|
|
相比传统在线代理,本项目具有以下特点:
|
|
|
|
|
|
2019-04-30 03:10:48 +00:00
|
|
|
|
## 服务端开销低
|
2019-04-30 02:52:09 +00:00
|
|
|
|
|
2019-04-30 03:05:46 +00:00
|
|
|
|
传统在线代理几乎都是在服务端替换 HTML/JS/CSS 等资源中的 URL。这不仅需要对内容做大量的分析和处理,还需对流量进行解压和再压缩,消耗大量 CPU 资源。并且由于逻辑较复杂,通常使用 Python/PHP 等编程语言自己实现。
|
2019-04-30 02:52:09 +00:00
|
|
|
|
|
2019-04-30 03:05:46 +00:00
|
|
|
|
为降低服务端开销,本项目使用浏览器的一个黑科技 —— Service Worker。它能让 JS 拦截网页产生的请求,并能自定义返回内容,相当于在浏览器内部实现一个反向代理。这使得绝大部分的内容处理都可以在浏览器上完成,服务器只需纯粹的转发流量。
|
2019-04-30 02:52:09 +00:00
|
|
|
|
|
|
|
|
|
因此本项目服务端直接使用 nginx,并且转发过程不修改内容(只修改 HTTP 头),避免了内容处理产生的巨大开销。同时得益于 nginx 丰富的功能,很多常用需求无需重新造轮子,通过简单配置即可实现。并且无论性能还是稳定性,都远高于自己实现。
|
|
|
|
|
|
2019-04-30 03:10:48 +00:00
|
|
|
|
## API 虚拟化
|
2019-04-30 02:52:09 +00:00
|
|
|
|
|
2019-04-30 03:05:46 +00:00
|
|
|
|
传统在线代理大多只针对静态 URL 的替换,忽视了动态 URL 以及和 URL 相关的网页 API。例如 a.com 反向代理 google.com,但页面中 JS 读取 `document.domain` 得到的仍是 a.com。这可能导致某些业务逻辑出现问题。
|
2019-04-30 02:52:09 +00:00
|
|
|
|
|
|
|
|
|
为缓解这个问题,本代理在页面头部注入一个 JS,用以重写绝大部分和 URL 相关的 API,使得页面中的 JS 获取到的仍是原始 URL:
|
|
|
|
|
|
|
|
|
|
![](https://raw.githubusercontent.com/EtherDream/jsproxy-localtest/temp/hook.png)
|
|
|
|
|
|
2019-05-02 07:10:10 +00:00
|
|
|
|
对于有些无法重写的 API,例如 `location`,本代理会将代码中字面出现的 `location` 替换成 `__location`,从而将操作转移到自定义对象上。当然对于非字面的情况(例如 `this['lo' + 'cation']`),目前还无法处理。
|
2019-04-30 03:05:46 +00:00
|
|
|
|
|
|
|
|
|
|
2019-04-30 02:52:09 +00:00
|
|
|
|
### 界面和接口分离
|
|
|
|
|
|
|
|
|
|
参见下文
|
|
|
|
|
|
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
# CHANGELOG
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
## v0.0.1
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:45:31 +00:00
|
|
|
|
虽然目前仍为概念演示状态,但相比[最初版本](https://github.com/EtherDream/jsproxy/tree/first-ver),有了很大变化:
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:45:31 +00:00
|
|
|
|
### 不再使用子域名
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:45:31 +00:00
|
|
|
|
使用子域名编码目标域名(例如 gg.jsproxy.tk),存在太多缺陷。例如 HTTPS 证书问题,DNS 性能和安全问题等。因此目前不再使用子域名,只用固定的域名,目标 URL 放在路径里。例如:
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
https://zjcqoo.github.io/-----https://www.google.com
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:45:31 +00:00
|
|
|
|
当然这也会产生很多新问题,例如无法支持 Cookie、页面之间没有同源策略限制等。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 05:12:56 +00:00
|
|
|
|
对于 Cookie,目前通过 JS 来维护,而不用浏览器原生(当然还有不少细节没实现)。这样的好处是前后端可以分离,前端页面可以放在第三方 Web 服务器上(例如 CDN、GitHub Pages),我们的服务器只提供代理接口。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:45:31 +00:00
|
|
|
|
这样一个页面可使用多个服务器的代理接口,并能实现线路切换、负载均衡等效果。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:45:31 +00:00
|
|
|
|
同源策略方面的限制目前暂未实现,因此不要进行登陆等操作,避免隐私泄露。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:45:31 +00:00
|
|
|
|
|
|
|
|
|
### 服务端优化
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 04:14:27 +00:00
|
|
|
|
安全改进:由于 Web 页面托管在第三方站点上,自己的服务器无需开启 443 端口,因此也无需 root 运行。同时支持 IP 黑名单功能,防止 SSRF 攻击。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 05:12:56 +00:00
|
|
|
|
代码改进:接口代理使用固定的 URL(参见 `api.conf`),不再使用任意路径,代码干净了很多。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
|
|
|
|
|
2019-04-23 07:22:34 +00:00
|
|
|
|
## 支持更多浏览器
|
|
|
|
|
|
|
|
|
|
相比之前版本只支持 Chrome,现在还支持最新的 Safari 和 FireFox。
|
|
|
|
|
|
|
|
|
|
注意:FireFox 隐身模式下不支持 Service Worker,只能普通模式访问。
|
|
|
|
|
|
|
|
|
|
|
2019-04-23 04:45:31 +00:00
|
|
|
|
### 提供一个首页
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-04-23 05:12:56 +00:00
|
|
|
|
虽然依旧简陋,但比之前好。提供了线路切换、预加载的功能。
|
2019-03-04 04:47:46 +00:00
|
|
|
|
|
2019-05-10 05:08:14 +00:00
|
|
|
|
|
|
|
|
|
# 当前开发中的功能...
|
|
|
|
|
|
|
|
|
|
## 增加节点切换
|
|
|
|
|
|
|
|
|
|
目前尝试将服务器分为两种:高级(延时低、带宽小、费用高),低级(延时高、带宽大、费用低)。
|
|
|
|
|
|
|
|
|
|
浏览器首先访问高级服务器,如果返回的是静态资源且体积较大,服务器只返回资源属性(大小、修改时间、首块哈希等),浏览器随后通过低级服务器获取完整资源;如果获取到的属性和之前不一致(例如 IP 变化导致),再从高级服务器获取完整内容。
|
|
|
|
|
|
|
|
|
|
这样设计,是为了降低高级服务器的带宽和流量成本,同时充分利用廉价服务器的资源。
|
|
|
|
|
|
|
|
|
|
目前演示中的低级服务使用的是 ClodeFlare Worker,其费用为 100 万次请求 / $0.5,没有带宽和流量限制,但延时较大,适合于体积较大的资源代理;高级服务为阿里轻量云,延时相对较小,上行带宽和流量有限,但下行流量免费且带宽较大,因此合适较小资源的代理,及其较大资源的属性获取。
|
|
|
|
|
|
|
|
|
|
使用这种方案,理想情况下可以支撑上百人同时观看高清视频。(当然现实中不少视频网站会关联用户 IP,导致节点切换失败,最终仍走高级服务器,难以达到这个数值)
|
|
|
|
|
|
|
|
|
|
未来会尝试进一步细分请求的优先级。例如同样是获取视频的请求,不同的片段范围,其优先级是不同的。当首次打开或者拖动进度时,用户希望能尽快看到内容,这就需要更高的优先级;当视频缓冲足够时,这时延时和稳定性已不再重要,因此可以走更廉价的节点。
|
|
|
|
|
|
|
|
|
|
当然具体的实现细节目前仍在探索和优化中,本质意义自然是物尽其用。这是一个很有意思的话题,有兴趣的可以交流讨论。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
# 类似项目
|
|
|
|
|
|
|
|
|
|
目前找到的都是传统后端替换 URL 的方案。当然后端替换也有不少优点,例如浏览器兼容性高,甚至低版本的 IE 都可以使用。
|
|
|
|
|
|
|
|
|
|
## zmirror
|
|
|
|
|
|
|
|
|
|
GitHub: https://github.com/aploium/zmirror
|
|
|
|
|
|
|
|
|
|
## php-proxy
|
|
|
|
|
|
|
|
|
|
GitHub: https://github.com/jenssegers/php-proxy
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
# 项目意义
|
|
|
|
|
|
|
|
|
|
本项目主要用于以下技术的研究:
|
|
|
|
|
|
|
|
|
|
* 网站镜像 / 沙盒化
|
|
|
|
|
|
|
|
|
|
* 钓鱼网站检测技术
|
|
|
|
|
|
|
|
|
|
* 前端资源访问加速
|
|
|
|
|
|
|
|
|
|
当然请勿将本项目用于非法用途,否则后果自负。
|
|
|
|
|
|
|
|
|
|
Demo 页面文明使用,不要进行登陆等涉及隐私的操作。
|
|
|
|
|
|
|
|
|
|
|
2019-03-04 04:47:46 +00:00
|
|
|
|
# License
|
|
|
|
|
|
|
|
|
|
MIT
|