VPS IP 被墙后，我用另一台 VPS 做跳板恢复服务

<div class="ops-article">
<p class="ops-note"><b>隐私说明：</b>这是一篇脱敏后的故障复盘。文中使用 <code>node.example.com</code>、<code>192.0.2.10</code>、<code>198.51.100.20</code>、<code>20001</code> 这类示例占位符；真实服务器地址、账户邮箱、API Key、登录密码、客户 UUID 和真实节点端口均不公开。</p>

<p>这次故障一开始看起来像是 XUI 面板里的节点全部失效：客户用 Shadowrocket 做连通性测试，结果大面积超时。第一反应很容易是“是不是 XUI 崩了”“是不是 Xray 配置错了”“是不是防火墙把客户端口关了”。</p>

<p>我没有先重装，也没有直接改客户配置，而是先做了几件确认：XUI 服务还在运行，Xray 配置测试通过，原来的客户节点端口在服务器本机仍然监听，从海外网络到主 VPS 的节点端口可以连通，但从国内网络访问同一批端口则超时。</p>

<p>这些信号合在一起，基本可以判断：问题不在 XUI 配置本身，而是主 VPS 的公网 IP 在部分地区的链路上出了问题。我的目标也很明确：尽快恢复客户使用，并且尽量不让客户修改 Shadowrocket 配置。</p>

<div class="ops-incident"><div class="ops-incident-title">这次恢复的关键路径</div><div class="ops-incident-grid"><div><b>先定位</b><span>服务没崩，问题在部分地区到主 IP 的链路。</span></div><div><b>再中转</b><span>备用 VPS 接住原域名和端口，转发回主 VPS。</span></div><div><b>后切回</b><span>主 IP 恢复后先切 DNS，观察稳定再清理中转。</span></div></div></div>

<h2>为什么不能简单套 Cloudflare 橙云</h2>

<p>我第一时间也考虑过把域名套到 Cloudflare 上。但这里有一个容易踩坑的地方：普通 Cloudflare 橙云代理并不能接管任意随机 TCP 端口。</p>

<div class="ops-grid">
<div class="ops-card"><span class="ops-badge">Cloudflare 端口限制</span><b>随机端口不是普通橙云的强项</b><p>Cloudflare 官方文档说明，默认代理的是 HTTP/HTTPS 的指定端口。如果业务使用其他随机端口，要么保持 DNS-only 灰云直连，要么使用 Spectrum。</p></div>
<div class="ops-card"><span class="ops-badge">DNS-only</span><b>灰云不是保护，但能保持直连</b><p>灰云状态下，DNS 返回源站真实 IP，流量不经过 Cloudflare 网络。对于普通随机 TCP 节点，这通常比强行橙云更安全。</p></div>
</div>

<p>所以，如果客户原来的配置是：</p>

<pre><code>node.example.com:随机端口</code></pre>

<p>普通橙云并不能直接让这些随机端口通过 Cloudflare。强行把域名橙云，反而可能导致所有随机端口节点都彻底不可用。这也是我最后选择“另一台 VPS 做跳板”的原因。</p>

<p>参考资料：<a href="https://developers.cloudflare.com/fundamentals/reference/network-ports/" target="_blank" rel="nofollow noopener">Cloudflare Network ports</a>、<a href="https://developers.cloudflare.com/dns/proxy-status/" target="_blank" rel="nofollow noopener">Cloudflare Proxy status</a>。</p>

<h2>方案：用备用 VPS 接住原来的域名和端口</h2>

<p>这次能做到客户无感切换，有一个前提：客户配置里的服务器地址是域名，而不是裸 IP。</p>

<div class="ops-flow">
<div><b>原路径：</b>客户 -> node.example.com -> 主 VPS</div>
<div><b>临时路径：</b>客户 -> node.example.com -> 备用 VPS -> 主 VPS</div>
<div><b>恢复路径：</b>客户 -> node.example.com -> 主 VPS</div>
</div>

<p>如果客户配置是域名加原端口，我可以把 <code>node.example.com</code> 的 A 记录从主 VPS 改到备用 VPS。备用 VPS 再把这些原端口转发回主 VPS。客户不需要改端口、不需要改 UUID、不需要改 WebSocket Path，也不需要重新导入订阅。</p>

<p class="ops-warn">如果客户配置里写的是裸 IP，例如 <code>192.0.2.10:20001</code>，DNS 切换不会影响它。这个场景下，要么客户改配置，要么只能等原 IP 恢复。</p>

<h2>第一步：确认主 VPS 的节点端口还活着</h2>

<p>我先在主 VPS 上确认服务状态：</p>

<pre><code>systemctl status x-ui --no-pager
ss -lntp
/usr/local/x-ui/bin/xray-linux-amd64 -test -c /usr/local/x-ui/bin/config.json</code></pre>

<p>然后从备用 VPS 上测试主 VPS 的节点端口：</p>

<pre><code>ORIGIN_IP="192.0.2.10"

for p in 20001 20002 20003 20004; do
  nc -z -w 3 "$ORIGIN_IP" "$p" && echo "$p open" || echo "$p closed"
done</code></pre>

<p>如果备用 VPS 到主 VPS 的这些端口是 open，说明主 VPS 的 Xray 入口还在，备用 VPS 可以作为中转。</p>

<h2>第二步：在备用 VPS 上安装并配置转发</h2>

<p>我用 <code>socat</code> 做用户态 TCP 转发。它的好处是直观：每个原端口在备用 VPS 上真实监听，再把连接转发到主 VPS 的同端口。</p>

<pre><code>apt update
apt install -y socat</code></pre>

<p>创建转发脚本：</p>

<pre><code>cat > /usr/local/sbin/xui-origin-forward.sh <<'EOF'
#!/bin/sh
set -eu

ORIGIN_IP="192.0.2.10"
PORTS_LIST="20001 20002 20003 20004"
PORTS_CSV="20001,20002,20003,20004"

iptables -C INPUT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null || \
  iptables -I INPUT 1 -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT

iptables -C ufw-user-input -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null || \
  iptables -I ufw-user-input 1 -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT

iptables -C IN_BT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null || \
  iptables -I IN_BT 1 -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT

iptables -C IN_BT_user_port -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null || \
  iptables -I IN_BT_user_port 1 -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT

if command -v iptables-save >/dev/null 2>&1; then
  mkdir -p /etc/iptables
  iptables-save > /etc/iptables/rules.v4
fi

for port in $PORTS_LIST; do
  /usr/bin/socat TCP-LISTEN:${port},reuseaddr,fork,keepalive TCP:${ORIGIN_IP}:${port} &
done

wait
EOF

chmod 0755 /usr/local/sbin/xui-origin-forward.sh</code></pre>

<p>这里我同时处理了几层防火墙：<code>INPUT</code>、<code>ufw-user-input</code>、<code>IN_BT</code> 和 <code>IN_BT_user_port</code>。只启动 <code>socat</code> 不够，端口还必须真的能从公网打进来。</p>

<h2>第三步：用 systemd 保持转发长期运行</h2>

<pre><code>cat > /etc/systemd/system/xui-origin-forward.service <<'EOF'
[Unit]
Description=Temporary XUI port forwarder
After=network-online.target
Wants=network-online.target

[Service]
Type=simple
ExecStart=/usr/local/sbin/xui-origin-forward.sh
Restart=always
RestartSec=3
KillMode=control-group

[Install]
WantedBy=multi-user.target
EOF

systemctl daemon-reload
systemctl enable xui-origin-forward.service
systemctl restart xui-origin-forward.service</code></pre>

<pre><code>systemctl is-enabled xui-origin-forward.service
systemctl is-active xui-origin-forward.service
ss -lntp | grep socat</code></pre>

<p>我期望看到 <code>enabled</code>、<code>active</code>，并且每个原节点端口都有一个 <code>socat</code> 监听。</p>

<h2>第四步：从外部验证备用 VPS 端口</h2>

<p>在改 DNS 之前，我先从外部测试备用 VPS 的端口：</p>

<pre><code>JUMP_IP="198.51.100.20"

for p in 20001 20002 20003 20004; do
  nc -vz -w 3 "$JUMP_IP" "$p"
done</code></pre>

<p>如果节点是 TLS + WebSocket，还可以做一个粗略的 HTTP 探测：</p>

<pre><code>curl -skI \
  --connect-timeout 5 \
  --max-time 8 \
  --resolve node.example.com:20001:198.51.100.20 \
  https://node.example.com:20001/</code></pre>

<p>如果返回 <code>400</code>、<code>404</code> 或类似响应，并不一定是坏事。普通 HTTP 请求不是完整的 WebSocket 握手，Xray 返回非业务响应很正常。关键是它不是连接失败、不是超时。</p>

<p>确认备用 VPS 端口可达后，我才切 DNS。如果在 Cloudflare 里管理 DNS，可以用 API。下面是模板，所有 ID 和 Key 都用占位符：</p>

<pre><code>read -rs CF_KEY

curl -sS -X PUT \
  -H "X-Auth-Email: admin@example.com" \
  -H "X-Auth-Key: $CF_KEY" \
  -H "Content-Type: application/json" \
  "https://api.cloudflare.com/client/v4/zones/<ZONE_ID>/dns_records/<RECORD_ID>" \
  --data '{"type":"A","name":"node.example.com","content":"198.51.100.20","ttl":1,"proxied":false}'</code></pre>

<p>注意这里的 <code>proxied</code> 是 <code>false</code>。这不是套橙云，而是 DNS-only 灰云直连。原因很简单：节点端口是随机 TCP 端口，普通橙云不能代理这些端口。</p>

<h2>第六步：客户侧恢复</h2>

<p>DNS 切到备用 VPS 后，客户如果原配置是域名，就可以直接重连。我当时的验证顺序是：</p>

<ul class="ops-checklist">
<li>备用 VPS 上确认转发服务仍然 active。</li>
<li>外部抽测几个原端口全部 open。</li>
<li>用原域名作为 SNI 强制走备用 VPS，确认能穿到主 VPS 的 Xray。</li>
<li>让客户重新连接 Shadowrocket。</li>
</ul>

<p>最重要的是，不要一边改 DNS 一边又改客户节点内容。故障恢复时变量越少越好。能不改客户端，就不要改客户端。</p>

<h2>三天后：等主 VPS 的 IP 恢复后如何切回去</h2>

<p>这类 IP 链路问题有时不是永久的。我给自己留了一个恢复顺序：先切回 DNS，确认稳定，再清理备用 VPS。</p>

<pre><code>ORIGIN_IP="192.0.2.10"

for p in 20001 20002 20003 20004; do
  nc -vz -w 3 "$ORIGIN_IP" "$p"
done</code></pre>

<p>还可以用原域名强制解析到主 VPS：</p>

<pre><code>curl -skI \
  --connect-timeout 5 \
  --max-time 8 \
  --resolve node.example.com:20001:192.0.2.10 \
  https://node.example.com:20001/</code></pre>

<pre><code>read -rs CF_KEY

<p>这一步完成后，我不会马上停备用 VPS 的转发。因为有些客户 DNS 缓存还没刷新，或者某些运营商递归 DNS 更新慢。备用 VPS 多保留几个小时甚至一天，成本很低，但能避免恢复窗口里出现二次故障。</p>

<h3>3. 确认客户稳定后，再清理备用 VPS</h3>

<pre><code>systemctl disable --now xui-origin-forward.service
rm -f /etc/systemd/system/xui-origin-forward.service
rm -f /usr/local/sbin/xui-origin-forward.sh
systemctl daemon-reload</code></pre>

<p>删除临时防火墙规则：</p>

<pre><code>PORTS_CSV="20001,20002,20003,20004"

while iptables -C INPUT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null; do
  iptables -D INPUT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT
done

while iptables -C ufw-user-input -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null; do
  iptables -D ufw-user-input -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT
done

while iptables -C IN_BT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null; do
  iptables -D IN_BT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT
done

while iptables -C IN_BT_user_port -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null; do
  iptables -D IN_BT_user_port -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT
done

iptables-save > /etc/iptables/rules.v4</code></pre>

<h2>2026年6月26日更新：第二次被墙后的处理与方案升级</h2>

<p>这篇文章发布后，类似故障又出现过一次。第二次的特征更明确：主 VPS 的服务本身还在，Xray 端口在服务器侧仍然监听，但从国内网络看，主 IP 的可达性大面积变差。也就是说，这不是一次“面板坏了”的故障，而是主 IP 所在链路再次不稳定。</p>

<div class="ops-incident"><div class="ops-incident-title">第二次处理时我调整了三件事</div><div class="ops-incident-grid"><div><b>先保住配置</b><span>确认 x-ui 数据库和运行配置没有被误删，再决定是否重启。</span></div><div><b>中转升级</b><span>从用户态 socat 转发，升级为 nftables DNAT + masquerade。</span></div><div><b>区分职责</b><span>跳板机自己的 x-ui 和透明转发不要互相抢端口。</span></div></div></div>

<h3>1. 先检查 x-ui 数据库，不急着重装</h3>

<p>这次排查时我遇到一个容易误判的问题：工作目录里的 <code>/usr/local/x-ui/x-ui.db</code> 可能变成 0 字节，但真实可用的数据库还在 <code>/etc/x-ui/x-ui.db</code>。如果这时直接重装或覆盖，很可能把原来的节点配置彻底弄乱。</p>

<pre><code>ls -lh /usr/local/x-ui/x-ui.db /etc/x-ui/x-ui.db
sqlite3 /etc/x-ui/x-ui.db 'select count(*) from inbounds;'</code></pre>

<p>确认 <code>/etc/x-ui/x-ui.db</code> 完整后，我的处理方式是让工作目录重新指向真实数据库：</p>

<pre><code>cp /usr/local/x-ui/bin/config.json /root/xui-config-backup-$(date +%Y%m%d-%H%M%S).json
rm -f /usr/local/x-ui/x-ui.db
ln -s /etc/x-ui/x-ui.db /usr/local/x-ui/x-ui.db
systemctl restart x-ui</code></pre>

<p class="ops-warn">这一段的关键不是命令本身，而是顺序：先备份运行配置，再确认真实数据库，再恢复链接。不要因为面板异常就立刻删库或重装。</p>

<h3>2. 为什么后来从 socat 换成 nftables DNAT</h3>

<p><code>socat</code> 的优点是快，适合临时救急；缺点是它是用户态转发，长期跑大量连接时不如内核 NAT 稳定，也会让源站看到的来源发生变化。第二次恢复后，我更倾向用 <code>nftables</code> 做透明 DNAT。</p>

<div class="ops-flow">
<div><b>临时救急：</b>客户 -> 跳板 VPS 的原端口 -> socat -> 主 VPS 原端口</div>
<div><b>长期中转：</b>客户 -> 跳板 VPS 的原端口 -> nftables DNAT -> 主 VPS 原端口</div>
<div><b>回包路径：</b>主 VPS -> 跳板 VPS masquerade -> 客户</div>
</div>

<p>核心规则不是“监听一个端口”，而是同时处理 DNAT、FORWARD 和回包伪装：</p>

<pre><code>table ip nat {
  chain prerouting {
    type nat hook prerouting priority dstnat; policy accept;
    tcp dport { 20001, 20002, 20003, 20004 } dnat to 192.0.2.10
  }

chain postrouting {
    type nat hook postrouting priority srcnat; policy accept;
    ip daddr 192.0.2.10 tcp dport { 20001, 20002, 20003, 20004 } masquerade
  }
}</code></pre>

<p>这里的 <code>192.0.2.10</code> 仍然是示例主 VPS 地址。真实操作时，还要配合 <code>FORWARD</code> 链放行这些端口，并关闭或替换会拦截转发的防火墙策略，例如默认阻断转发的 UFW。</p>

<h3>3. 跳板机自己的 x-ui 和转发不要混在一起判断</h3>

<p>第二次处理中还有一个容易混淆的点：跳板机可以有自己的 x-ui，也可以负责把主 VPS 的原端口转发出去，但这两件事要分清。一个端口如果已经被跳板机本地 Xray 监听，透明 DNAT 可能就不会按预期处理这个端口。</p>

<div class="ops-grid">
<div class="ops-card"><b>纯透明转发</b><p>跳板机不在这些端口上跑自己的 Xray，只做 DNAT。优点是客户配置最少变化，排障路径也最清楚。</p></div>
<div class="ops-card"><b>跳板机本地 x-ui</b><p>跳板机自己也提供节点时，要确认端口、UUID、Path、证书和过期状态，不要让本地入站和转发端口冲突。</p></div>
</div>

<p>所以我后来把检查顺序固定下来：先看主 VPS 原端口是否健康，再看跳板机端口是否被本地进程占用，最后看 nftables 规则是否真正加载。这样可以避免把“跳板机本地 x-ui 抢端口”误判成“主 VPS 又坏了”。</p>

<pre><code>ss -tlnp | grep xray
nft list ruleset
systemctl status xui-dnat-forward.service --no-pager</code></pre>

<p>这次升级后的结论是：短期故障恢复可以用 <code>socat</code> 争取时间；如果主 IP 长时间不稳定，就应该把中转做成可维护的 nftables DNAT 服务，并把跳板机本地节点和透明转发的职责明确隔离。</p>

<h2>我这次学到的几个教训</h2>

<div class="ops-grid">
<div class="ops-card"><b>客户配置尽量使用域名</b><p>如果节点地址写的是裸 IP，主 IP 一旦不可达，就很难无感切走。域名不是为了好看，而是为了故障切换。</p></div>
<div class="ops-card"><b>普通橙云不是万能 TCP 代理</b><p>随机端口的 Xray/XUI 节点不能指望普通橙云直接救回来。除非迁移到 Cloudflare 支持的标准 HTTPS 端口，或者使用 Spectrum。</p></div>
<div class="ops-card"><b>先验证再切 DNS</b><p>备用 VPS 上监听了端口，不代表外部能进来。必须验证本机防火墙、云安全组、外部端口和 SNI 穿透。</p></div>
<div class="ops-card"><b>恢复时不要急着删中转</b><p>切回主 VPS 后，中转最好多保留一段时间。DNS 缓存不是所有客户端同时刷新，太早删除可能造成二次掉线。</p></div>
</div>

<h2>最后的恢复清单</h2>

<ul class="ops-checklist">
<li>确认主 VPS 服务未崩，只是部分地区不可达。</li>
<li>从备用 VPS 测主 VPS 原端口是否可达。</li>
<li>在备用 VPS 上用 <code>socat</code> 监听原端口并转发到主 VPS。</li>
<li>在备用 VPS 的 <code>INPUT</code>、UFW、宝塔链、安全组里放行原端口。</li>
<li>外部验证备用 VPS 原端口全部 open。</li>
<li>将业务域名 A 记录切到备用 VPS，保持 DNS-only。</li>
<li>客户恢复后保持观察。</li>
<li>等主 VPS IP 恢复，先把 DNS 切回主 VPS。</li>
<li>客户稳定后，再清理备用 VPS 中转服务和防火墙规则。</li>
</ul>

<p>这套方法不优雅，但很实用。它最大的价值是：在主 VPS 的 IP 临时不可达时，只要主 VPS 本身还能从备用 VPS 访问，就可以用备用 VPS 把原域名和原端口接住，为客户争取恢复时间。</p>
</div>

隐私说明：这是一篇脱敏后的故障复盘。文中使用 node.example.com、192.0.2.10、198.51.100.20、20001 这类示例占位符；真实服务器地址、账户邮箱、API Key、登录密码、客户 UUID 和真实节点端口均不公开。

这次故障一开始看起来像是 XUI 面板里的节点全部失效：客户用 Shadowrocket 做连通性测试，结果大面积超时。第一反应很容易是“是不是 XUI 崩了”“是不是 Xray 配置错了”“是不是防火墙把客户端口关了”。

我没有先重装，也没有直接改客户配置，而是先做了几件确认：XUI 服务还在运行，Xray 配置测试通过，原来的客户节点端口在服务器本机仍然监听，从海外网络到主 VPS 的节点端口可以连通，但从国内网络访问同一批端口则超时。

这些信号合在一起，基本可以判断：问题不在 XUI 配置本身，而是主 VPS 的公网 IP 在部分地区的链路上出了问题。我的目标也很明确：尽快恢复客户使用，并且尽量不让客户修改 Shadowrocket 配置。

这次恢复的关键路径

先定位服务没崩，问题在部分地区到主 IP 的链路。

再中转备用 VPS 接住原域名和端口，转发回主 VPS。

后切回主 IP 恢复后先切 DNS，观察稳定再清理中转。

为什么不能简单套 Cloudflare 橙云

我第一时间也考虑过把域名套到 Cloudflare 上。但这里有一个容易踩坑的地方：普通 Cloudflare 橙云代理并不能接管任意随机 TCP 端口。

Cloudflare 端口限制随机端口不是普通橙云的强项

Cloudflare 官方文档说明，默认代理的是 HTTP/HTTPS 的指定端口。如果业务使用其他随机端口，要么保持 DNS-only 灰云直连，要么使用 Spectrum。

DNS-only灰云不是保护，但能保持直连

灰云状态下，DNS 返回源站真实 IP，流量不经过 Cloudflare 网络。对于普通随机 TCP 节点，这通常比强行橙云更安全。

所以，如果客户原来的配置是：

node.example.com:随机端口

普通橙云并不能直接让这些随机端口通过 Cloudflare。强行把域名橙云，反而可能导致所有随机端口节点都彻底不可用。这也是我最后选择“另一台 VPS 做跳板”的原因。

参考资料：Cloudflare Network ports、Cloudflare Proxy status。

方案：用备用 VPS 接住原来的域名和端口

这次能做到客户无感切换，有一个前提：客户配置里的服务器地址是域名，而不是裸 IP。

原路径：客户 -> node.example.com -> 主 VPS

临时路径：客户 -> node.example.com -> 备用 VPS -> 主 VPS

恢复路径：客户 -> node.example.com -> 主 VPS

如果客户配置是域名加原端口，我可以把 node.example.com 的 A 记录从主 VPS 改到备用 VPS。备用 VPS 再把这些原端口转发回主 VPS。客户不需要改端口、不需要改 UUID、不需要改 WebSocket Path，也不需要重新导入订阅。

如果客户配置里写的是裸 IP，例如 192.0.2.10:20001，DNS 切换不会影响它。这个场景下，要么客户改配置，要么只能等原 IP 恢复。

第一步：确认主 VPS 的节点端口还活着

我先在主 VPS 上确认服务状态：

systemctl status x-ui --no-pager
ss -lntp
/usr/local/x-ui/bin/xray-linux-amd64 -test -c /usr/local/x-ui/bin/config.json

然后从备用 VPS 上测试主 VPS 的节点端口：

ORIGIN_IP="192.0.2.10"

for p in 20001 20002 20003 20004; do
  nc -z -w 3 "$ORIGIN_IP" "$p" && echo "$p open" || echo "$p closed"
done

如果备用 VPS 到主 VPS 的这些端口是 open，说明主 VPS 的 Xray 入口还在，备用 VPS 可以作为中转。

第二步：在备用 VPS 上安装并配置转发

我用 socat 做用户态 TCP 转发。它的好处是直观：每个原端口在备用 VPS 上真实监听，再把连接转发到主 VPS 的同端口。

apt update
apt install -y socat

创建转发脚本：

cat > /usr/local/sbin/xui-origin-forward.sh <<'EOF'
#!/bin/sh
set -eu

ORIGIN_IP="192.0.2.10"
PORTS_LIST="20001 20002 20003 20004"
PORTS_CSV="20001,20002,20003,20004"

iptables -C INPUT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null || \
  iptables -I INPUT 1 -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT

iptables -C ufw-user-input -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null || \
  iptables -I ufw-user-input 1 -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT

iptables -C IN_BT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null || \
  iptables -I IN_BT 1 -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT

iptables -C IN_BT_user_port -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null || \
  iptables -I IN_BT_user_port 1 -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT

if command -v iptables-save >/dev/null 2>&1; then
  mkdir -p /etc/iptables
  iptables-save > /etc/iptables/rules.v4
fi

for port in $PORTS_LIST; do
  /usr/bin/socat TCP-LISTEN:${port},reuseaddr,fork,keepalive TCP:${ORIGIN_IP}:${port} &
done

wait
EOF

chmod 0755 /usr/local/sbin/xui-origin-forward.sh

这里我同时处理了几层防火墙：INPUT、ufw-user-input、IN_BT 和 IN_BT_user_port。只启动 socat 不够，端口还必须真的能从公网打进来。

第三步：用 systemd 保持转发长期运行

cat > /etc/systemd/system/xui-origin-forward.service <<'EOF'
[Unit]
Description=Temporary XUI port forwarder
After=network-online.target
Wants=network-online.target

[Service]
Type=simple
ExecStart=/usr/local/sbin/xui-origin-forward.sh
Restart=always
RestartSec=3
KillMode=control-group

[Install]
WantedBy=multi-user.target
EOF

systemctl daemon-reload
systemctl enable xui-origin-forward.service
systemctl restart xui-origin-forward.service

确认状态：

systemctl is-enabled xui-origin-forward.service
systemctl is-active xui-origin-forward.service
ss -lntp | grep socat

我期望看到 enabled、active，并且每个原节点端口都有一个 socat 监听。

第四步：从外部验证备用 VPS 端口

在改 DNS 之前，我先从外部测试备用 VPS 的端口：

JUMP_IP="198.51.100.20"

for p in 20001 20002 20003 20004; do
  nc -vz -w 3 "$JUMP_IP" "$p"
done

如果节点是 TLS + WebSocket，还可以做一个粗略的 HTTP 探测：

curl -skI \
  --connect-timeout 5 \
  --max-time 8 \
  --resolve node.example.com:20001:198.51.100.20 \
  https://node.example.com:20001/

如果返回 400、404 或类似响应，并不一定是坏事。普通 HTTP 请求不是完整的 WebSocket 握手，Xray 返回非业务响应很正常。关键是它不是连接失败、不是超时。

第五步：切 DNS 到备用 VPS

确认备用 VPS 端口可达后，我才切 DNS。如果在 Cloudflare 里管理 DNS，可以用 API。下面是模板，所有 ID 和 Key 都用占位符：

read -rs CF_KEY

curl -sS -X PUT \
  -H "X-Auth-Email: [email protected]" \
  -H "X-Auth-Key: $CF_KEY" \
  -H "Content-Type: application/json" \
  "https://api.cloudflare.com/client/v4/zones/<ZONE_ID>/dns_records/<RECORD_ID>" \
  --data '{"type":"A","name":"node.example.com","content":"198.51.100.20","ttl":1,"proxied":false}'

注意这里的 proxied 是 false。这不是套橙云，而是 DNS-only 灰云直连。原因很简单：节点端口是随机 TCP 端口，普通橙云不能代理这些端口。

第六步：客户侧恢复

DNS 切到备用 VPS 后，客户如果原配置是域名，就可以直接重连。我当时的验证顺序是：

备用 VPS 上确认转发服务仍然 active。
外部抽测几个原端口全部 open。
用原域名作为 SNI 强制走备用 VPS，确认能穿到主 VPS 的 Xray。
让客户重新连接 Shadowrocket。

最重要的是，不要一边改 DNS 一边又改客户节点内容。故障恢复时变量越少越好。能不改客户端，就不要改客户端。

三天后：等主 VPS 的 IP 恢复后如何切回去

这类 IP 链路问题有时不是永久的。我给自己留了一个恢复顺序：先切回 DNS，确认稳定，再清理备用 VPS。

1. 先确认主 VPS 真的恢复

ORIGIN_IP="192.0.2.10"

for p in 20001 20002 20003 20004; do
  nc -vz -w 3 "$ORIGIN_IP" "$p"
done

还可以用原域名强制解析到主 VPS：

curl -skI \
  --connect-timeout 5 \
  --max-time 8 \
  --resolve node.example.com:20001:192.0.2.10 \
  https://node.example.com:20001/

2. 先只把 DNS 切回主 VPS

read -rs CF_KEY

curl -sS -X PUT \
  -H "X-Auth-Email: [email protected]" \
  -H "X-Auth-Key: $CF_KEY" \
  -H "Content-Type: application/json" \
  "https://api.cloudflare.com/client/v4/zones/<ZONE_ID>/dns_records/<RECORD_ID>" \
  --data '{"type":"A","name":"node.example.com","content":"192.0.2.10","ttl":1,"proxied":false}'

这一步完成后，我不会马上停备用 VPS 的转发。因为有些客户 DNS 缓存还没刷新，或者某些运营商递归 DNS 更新慢。备用 VPS 多保留几个小时甚至一天，成本很低，但能避免恢复窗口里出现二次故障。

3. 确认客户稳定后，再清理备用 VPS

systemctl disable --now xui-origin-forward.service
rm -f /etc/systemd/system/xui-origin-forward.service
rm -f /usr/local/sbin/xui-origin-forward.sh
systemctl daemon-reload

删除临时防火墙规则：

PORTS_CSV="20001,20002,20003,20004"

while iptables -C INPUT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null; do
  iptables -D INPUT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT
done

while iptables -C ufw-user-input -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null; do
  iptables -D ufw-user-input -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT
done

while iptables -C IN_BT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null; do
  iptables -D IN_BT -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT
done

while iptables -C IN_BT_user_port -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT 2>/dev/null; do
  iptables -D IN_BT_user_port -p tcp -m multiport --dports "$PORTS_CSV" -j ACCEPT
done

iptables-save > /etc/iptables/rules.v4

2026年6月26日更新：第二次被墙后的处理与方案升级

这篇文章发布后，类似故障又出现过一次。第二次的特征更明确：主 VPS 的服务本身还在，Xray 端口在服务器侧仍然监听，但从国内网络看，主 IP 的可达性大面积变差。也就是说，这不是一次“面板坏了”的故障，而是主 IP 所在链路再次不稳定。

第二次处理时我调整了三件事

先保住配置确认 x-ui 数据库和运行配置没有被误删，再决定是否重启。

中转升级从用户态 socat 转发，升级为 nftables DNAT + masquerade。

区分职责跳板机自己的 x-ui 和透明转发不要互相抢端口。

1. 先检查 x-ui 数据库，不急着重装

这次排查时我遇到一个容易误判的问题：工作目录里的 /usr/local/x-ui/x-ui.db 可能变成 0 字节，但真实可用的数据库还在 /etc/x-ui/x-ui.db。如果这时直接重装或覆盖，很可能把原来的节点配置彻底弄乱。

ls -lh /usr/local/x-ui/x-ui.db /etc/x-ui/x-ui.db
sqlite3 /etc/x-ui/x-ui.db 'select count(*) from inbounds;'

确认 /etc/x-ui/x-ui.db 完整后，我的处理方式是让工作目录重新指向真实数据库：

cp /usr/local/x-ui/bin/config.json /root/xui-config-backup-$(date +%Y%m%d-%H%M%S).json
rm -f /usr/local/x-ui/x-ui.db
ln -s /etc/x-ui/x-ui.db /usr/local/x-ui/x-ui.db
systemctl restart x-ui

这一段的关键不是命令本身，而是顺序：先备份运行配置，再确认真实数据库，再恢复链接。不要因为面板异常就立刻删库或重装。

2. 为什么后来从 socat 换成 nftables DNAT

socat 的优点是快，适合临时救急；缺点是它是用户态转发，长期跑大量连接时不如内核 NAT 稳定，也会让源站看到的来源发生变化。第二次恢复后，我更倾向用 nftables 做透明 DNAT。

临时救急：客户 -> 跳板 VPS 的原端口 -> socat -> 主 VPS 原端口

长期中转：客户 -> 跳板 VPS 的原端口 -> nftables DNAT -> 主 VPS 原端口

回包路径：主 VPS -> 跳板 VPS masquerade -> 客户

核心规则不是“监听一个端口”，而是同时处理 DNAT、FORWARD 和回包伪装：

table ip nat {
  chain prerouting {
    type nat hook prerouting priority dstnat; policy accept;
    tcp dport { 20001, 20002, 20003, 20004 } dnat to 192.0.2.10
  }

  chain postrouting {
    type nat hook postrouting priority srcnat; policy accept;
    ip daddr 192.0.2.10 tcp dport { 20001, 20002, 20003, 20004 } masquerade
  }
}

这里的 192.0.2.10 仍然是示例主 VPS 地址。真实操作时，还要配合 FORWARD 链放行这些端口，并关闭或替换会拦截转发的防火墙策略，例如默认阻断转发的 UFW。

3. 跳板机自己的 x-ui 和转发不要混在一起判断

第二次处理中还有一个容易混淆的点：跳板机可以有自己的 x-ui，也可以负责把主 VPS 的原端口转发出去，但这两件事要分清。一个端口如果已经被跳板机本地 Xray 监听，透明 DNAT 可能就不会按预期处理这个端口。

纯透明转发

跳板机不在这些端口上跑自己的 Xray，只做 DNAT。优点是客户配置最少变化，排障路径也最清楚。

跳板机本地 x-ui

跳板机自己也提供节点时，要确认端口、UUID、Path、证书和过期状态，不要让本地入站和转发端口冲突。

所以我后来把检查顺序固定下来：先看主 VPS 原端口是否健康，再看跳板机端口是否被本地进程占用，最后看 nftables 规则是否真正加载。这样可以避免把“跳板机本地 x-ui 抢端口”误判成“主 VPS 又坏了”。

ss -tlnp | grep xray
nft list ruleset
systemctl status xui-dnat-forward.service --no-pager

这次升级后的结论是：短期故障恢复可以用 socat 争取时间；如果主 IP 长时间不稳定，就应该把中转做成可维护的 nftables DNAT 服务，并把跳板机本地节点和透明转发的职责明确隔离。

我这次学到的几个教训

客户配置尽量使用域名

如果节点地址写的是裸 IP，主 IP 一旦不可达，就很难无感切走。域名不是为了好看，而是为了故障切换。

普通橙云不是万能 TCP 代理

随机端口的 Xray/XUI 节点不能指望普通橙云直接救回来。除非迁移到 Cloudflare 支持的标准 HTTPS 端口，或者使用 Spectrum。

先验证再切 DNS

备用 VPS 上监听了端口，不代表外部能进来。必须验证本机防火墙、云安全组、外部端口和 SNI 穿透。

恢复时不要急着删中转

切回主 VPS 后，中转最好多保留一段时间。DNS 缓存不是所有客户端同时刷新，太早删除可能造成二次掉线。

最后的恢复清单

确认主 VPS 服务未崩，只是部分地区不可达。
从备用 VPS 测主 VPS 原端口是否可达。
在备用 VPS 上用 socat 监听原端口并转发到主 VPS。
在备用 VPS 的 INPUT、UFW、宝塔链、安全组里放行原端口。
外部验证备用 VPS 原端口全部 open。
将业务域名 A 记录切到备用 VPS，保持 DNS-only。
客户恢复后保持观察。
等主 VPS IP 恢复，先把 DNS 切回主 VPS。
客户稳定后，再清理备用 VPS 中转服务和防火墙规则。

这套方法不优雅，但很实用。它最大的价值是：在主 VPS 的 IP 临时不可达时，只要主 VPS 本身还能从备用 VPS 访问，就可以用备用 VPS 把原域名和原端口接住，为客户争取恢复时间。

最后修改：2026 年 06 月 30 日

Thanks for reading.

VPS IP 被墙后，我用另一台 VPS 做跳板恢复服务

为什么不能简单套 Cloudflare 橙云

方案：用备用 VPS 接住原来的域名和端口

第一步：确认主 VPS 的节点端口还活着

第二步：在备用 VPS 上安装并配置转发

第三步：用 systemd 保持转发长期运行

第四步：从外部验证备用 VPS 端口

第五步：切 DNS 到备用 VPS

第六步：客户侧恢复

三天后：等主 VPS 的 IP 恢复后如何切回去

1. 先确认主 VPS 真的恢复

2. 先只把 DNS 切回主 VPS

3. 确认客户稳定后，再清理备用 VPS

2026年6月26日更新：第二次被墙后的处理与方案升级

1. 先检查 x-ui 数据库，不急着重装

2. 为什么后来从 socat 换成 nftables DNAT

3. 跳板机自己的 x-ui 和转发不要混在一起判断

我这次学到的几个教训

最后的恢复清单

发表评论取消回复
Cookies are used to keep your comment profile for next time.

港美股交易费用全景：盈透、嘉信、盈立、众安、致富、汇丰香港对比（2026-05）

境外投资、个人购汇与CRS：几个容易混淆的问题一次讲清

港美股券商入金方式横向对比：嘉信国际、盈透、致富、富途、老虎怎么选（2026版）

VPS IP 被墙后，我用另一台 VPS 做跳板恢复服务

开源量化交易工具全景：从数据、回测到 AI Agent 的项目地图

境外投资、个人购汇与CRS：几个容易混淆的问题一次讲清

港美股券商入金方式横向对比：嘉信国际、盈透、致富、富途、老虎怎么选（2026版）

开源量化交易工具全景：从数据、回测到 AI Agent 的项目地图

港美股交易费用全景：盈透、嘉信、盈立、众安、致富、汇丰香港对比（2026-05）

VPS IP 被墙后，我用另一台 VPS 做跳板恢复服务

VPS IP 被墙后，我用另一台 VPS 做跳板恢复服务

为什么不能简单套 Cloudflare 橙云

方案：用备用 VPS 接住原来的域名和端口

第一步：确认主 VPS 的节点端口还活着

第二步：在备用 VPS 上安装并配置转发

第三步：用 systemd 保持转发长期运行

第四步：从外部验证备用 VPS 端口

第五步：切 DNS 到备用 VPS

第六步：客户侧恢复

三天后：等主 VPS 的 IP 恢复后如何切回去

1. 先确认主 VPS 真的恢复

2. 先只把 DNS 切回主 VPS

3. 确认客户稳定后，再清理备用 VPS

2026年6月26日更新：第二次被墙后的处理与方案升级

1. 先检查 x-ui 数据库，不急着重装

2. 为什么后来从 socat 换成 nftables DNAT

3. 跳板机自己的 x-ui 和转发不要混在一起判断

我这次学到的几个教训

最后的恢复清单

发表评论 取消回复 Cookies are used to keep your comment profile for next time.

VPS IP 被墙后，我用另一台 VPS 做跳板恢复服务

发表评论取消回复
Cookies are used to keep your comment profile for next time.