Fanssen Notes

凡森科技 · 技术笔记每天从推特上找一个 GitHub 项目，研究、部署、写心得。这里有我的技术笔记、项目实战、以及踩坑记录。

aibestapp.top：一个全栈小网站的自我修养

这不是一个普通网站第一次打开 aibestapp.top 的人，通常会以为这是一个 AI 资讯站或者工具导航站。这么说也没错，但仔细一逛就会发现——这其实是一个工具箱。我的初衷很简单：做一个自己能用的、有实用价值的网站，而不是那种从别处搬运内容、同质化严重的"伪站点"。aibestapp.top 集成了 AI 工具导航、API 可用性检测、性格测试、网页小游戏，还有后续计划添加的教程文章模块。看起来杂，但每个功能都是我自己写出来的原创东西，这一点让我觉得踏实。技术栈的选择逻辑这个站的技术选型比较有意思。先说首页，打开就能看到一个 3D 粒子动画，不断旋转变化，视觉效果还算可以。这个动画是用 Three.js 写的，纯前端渲染，不需要后端资源支撑。选择 Three.js 其实不是网站本身的需要。一个工具导航站，静态页面就够了，搞什么 3D 动画？但做个人项目的好处就在这里——你不必事事都从产品最优解出发。我刚好在学 Three.js，想找个实战项目练手，就直接拿首页当了试验场。技术选型这件事，在大厂项目里得考虑团队协作、维护成本、稳定性一堆东西，到了自己的项目，就可以任性一点，想用什么就用什么。首页以外的子页面，我全部用了纯静态 HTML/CSS/JavaScript，没有引入任何前端框架。这个决定有几个实际好处：第一，没有构建步骤，写完了直接在浏览器打开就能预览，开发效率极高。第二，部署极其简单，把文件扔到 Nginx 的静态目录下，配个 HTTPS 就完事了。第三，零运行依赖，不存在版本冲突或者依赖包出问题的情况。部署方面，服务器放在了香港，用 Nginx 做反向代理，HTTPS 证书通过 Certbot 自动续期，全程自动化。后端目前是零——整个站点全部静态，这也是为什么我敢说"零维护成本"。四个核心功能模块目前网站有四个主要页面，每个都有自己的定位和用途。 Toolbox —— AI 工具导航这是站点的核心入口。我整理了一批常用的 AI 工具，按照功能分类做了导航。跟市面上的导航站不同，这里收录的工具都经过我自己实际使用和筛选，不是广撒网式的收录。每个工具我会写上简要的使用场景和体验评价，帮助访问者快速判断是否适合自己。 Key Checker —— API 密钥可用性检测这个工具源于我自己的一个痛点。做 AI 相关开发，手头经常有多个 API Key，时间久了分不清哪些还能用、哪些已经过期。于是我写了一个检测工具，输入 API Key，它会自动调用 10 个常用 API 端点逐一验证，返回每个端点的可用状态。技术实现上就是纯前端的 AJAX 请求，没有后端代理。这样做的好处是用户的 Key 不会经过我的服务器，隐私方面更安全。缺点是受浏览器跨域限制，部分 API 端点无法直接检测，这些还在想办法优化。 MBTI 性格测试一个轻量级的 MBTI 测试工具。这个功能做得比较简单，就是标准的八维题目，用户回答完自动计算并展示性格类型。没有做后台数据统计，也没有用户系统。 ...

Hugo 博客搭建：从零到国内可访问的全过程

大家好，我是一凡。这篇博客记录了我用 Hugo + PaperMod 搭建技术博客的完整过程，包括选型思路、架构设计、配置细节和踩坑记录。希望对正在折腾博客的朋友有帮助。为什么最终选了 Hugo 市面上静态博客生成器不少，我逐一试过，说说我个人的感受。 Jekyll 是老牌选手，GitHub Pages 原生支持，生态成熟。但它基于 Ruby，本地环境配置比较折腾，我每次换电脑都要重新装 Ruby 和 bundle，而且编译速度慢，几百篇文章要等十几秒，迭代体验不好。 Hexo 基于 Node.js，社区主题丰富，中文资料也多。但它的编译速度随着文章增多下降明显，而且依赖 node_modules，一旦依赖版本冲突就头疼。另外它的配置文件结构个人感觉偏重，不太直观。 Astro 比较新，设计理念很好，支持岛屿架构，可以做很复杂的页面。但对于一个纯博客来说有点杀鸡用牛刀了。Astro 的构建依赖 npm，项目体积也大，而且学习曲线相对陡，为了写个博客去学一套新框架，感觉有点划不来。 Hugo 吸引我的地方有几个：编译极快，我目前几十篇文章，构建时间在 100ms 左右，基本是瞬间完成；单二进制文件，没有运行环境依赖，macOS 上 brew install hugo 就搞定；模板语法虽然有点怪，但配置本身很简单，一个 config.yaml 就能跑起来。至于主题，我选的是 PaperMod。它是 Paper 主题的维护升级版，GitHub 上 10k+ star，社区活跃，基本周更。功能上该有的都有：暗黑模式、全文搜索、代码复制按钮、目录 TOC、RSS 订阅，而且 UI 干净，不花哨，对阅读体验友好。需求拆解与方案设计动手之前，我先把博客的需求列了一下，避免后面跑偏：零成本托管 —— 博客没有营收，不想每个月掏服务器钱国内能正常访问 —— 我的读者大部分在国内，如果打不开等于白写写作流程越简单越好 —— 最好是本地写 Markdown，推送即更新域名统一品牌 —— 博客用子域名挂在我主站品牌下这四条的最终方案分别是：托管 → GitHub Pages，完全免费，香港和日本节点访问速度尚可国内访问 → 香港轻量服务器 Nginx 反向代理，几十块钱一个月，只转发静态文件，负载极低自动化 → GitHub Actions，推 main 分支自动构建部署域名 → blog.aibestapp.top，跟主站同一域名体系这里说一个小细节。GitHub Pages 默认绑定的是 username.github.io 这种域名，你可以绑自定义域名，但 GitHub 的 IP 在国内部分地区会被墙或者丢包严重。即使绑了自定义域名，国内访问还是不稳定。所以我干脆让它走 GitHub Pages 的原生域名，然后在前面加一层香港反代，这样国内访问走反代，国外直接访问 GitHub Pages，两边都不受影响。 ...

LoRA 训练实战：用 Flux 生成稳定角色形象

前言大家好，我是一凡。AI 生图发展到今天，论单张质量已经相当能打了。但做内容的人都知道——一致性才是真正的难题。我之前做一个漫画系列，主角需要每张图都长一个样。结果呢？今天生成一张帅脸，明天改个 prompt 再跑，出来完全就是另一个人。尝试了几十次 prompt 微调，效果都很随机。后来决定用 LoRA 来解决这个问题。这篇文章把整个过程拆开来讲，从样本准备到训练参数，再到 API 调用的坑，希望能帮到有同样需求的同学。 LoRA 是什么，为什么用它 LoRA（Low-Rank Adaptation）最早是 NLP 领域的微调方法，后来被引入到图像生成模型里。它的核心思路很简单：用少量图片训练一个轻量级的权重矩阵，记录特定人物或风格的特征。出图的时候加载这个权重，AI 就知道"这个人的脸长这样"。相比全量微调，LoRA 的优势很明显：训练速度快：在你自己的电脑上，用一张消费级显卡，跑一两个小时就能出结果文件体积小：一个 LoRA 文件通常几十 MB，存储和加载都很方便即插即用：不影响原模型的任何能力，加载就生效，不加载就不生效可组合：同一张图可以叠加多个 LoRA（比如一个人物 LoRA + 一个风格 LoRA）我选的是 Flux 模型 + Replicate 平台来训练和部署，流程相对标准化，下面一步步说。第一步：样本准备（决定成败）这句话我说在前面——训练 LoRA 的上限 80% 由样本质量决定。模型再强，数据烂也白搭。选什么样的照片第一次训练的时候，我 Google 了 30 多张照片，什么角度都有就扔进去了。结果出来的 LoRA 效果非常糟糕——五官位置是对的，但整体感觉就是"像又不像"，AI 把不同角度的特征混在一起，生成了一个"平均脸"。第二次我只用了 12 张，但每张都严格筛选。我总结的筛选标准如下：标准说明为什么重要正面为主正脸或微侧（30°以内）特征信息最多，模型最容易学习光线均匀避免阴阳脸、强背光阴影会干扰五官特征的提取画面占比大人脸占画面的 60% 以上像素级信息越丰富，特征越精确表情自然微笑或中性表情夸张表情会把肌肉变形当成特征学进去清晰度够不低于 1024×1024 模糊照片只会让模型学到噪点背景简单纯色或虚化背景避免模型把背景元素当成特征样本数量多少合适我的经验：12-15 张高质量 > 50 张杂图。 ...

MediaCrawler：小红书数据采集实战

为什么需要爬取小红书数据做内容运营的人，大概都遇到过一个问题：不知道发什么。运营这件事，最怕的是闭门造车。你在这里想选题想了两天，结果别人发的内容比你精心策划的还要好。如果能知道同行在发什么、什么内容受欢迎，至少能给选题方向提供一些参考。爬取小红书的数据，主要就是为了做竞品分析。看一下同类账号的发文频率、内容类型、标题风格、互动数据。这些信息可以帮你在做内容计划的时候更有方向。我自己做的是一个国际教育方向的账号，一开始完全是在摸索。今天发一条课程介绍，明天发一条海外生活，数据起起伏伏，完全找不到规律。后来决定看看同行都在做什么，才想到用爬虫来获取数据。选型考量：为什么是 MediaCrawler 爬虫工具其实不少，但针对小红书这种有反爬机制的平台，开箱即用的不多。我之前试过自己写 requests 加代理池的方案，听起来很酷，实际跑起来全是坑。小红书的风控做得很细，光是登录这一关就能折腾一整天。好不容易爬上去了，发几个请求就被封了。维护成本太高，不适合做长期的数据收集。后来在 GitHub 上看到了 MediaCrawler，试用了一下，感觉最大的优势是：多平台支持。它不只能爬小红书，还支持抖音、B 站、微博。同一个工具，改一下参数就能切换平台。对我这种可能以后要做多平台内容的人来说，学一个工具就够了。登录和 Cookie 管理已经处理好了。MediaCrawler 通过浏览器模拟登录，把登录状态持久化。我只需要第一次手动扫码登录，后续的请求都会自动携带有效的 Cookie。这部分是很多爬虫工具没有做好的地方。数据输出格式规范。数据以 JSONL 格式输出，每行一个完整的 JSON 对象。后续无论是做统计分析还是训练模型，处理起来都很方便。部署和配置的全过程说回到部署，其实过程不算复杂，但有几个坑值得记下来。环境准备 MediaCrawler 基于 Python，依赖管理用的是 pip。我是在 macOS 上跑的，步骤大概是： git clone https://github.com/NanmiCoder/MediaCrawler.git cd MediaCrawler pip install -r requirements.txt 依赖比较多，建议用虚拟环境。我一开始直接在全局环境装，结果跟已有的包版本冲突了，折腾了半天。后来用 conda 新建了一个环境，一步到位。浏览器驱动的配置 MediaCrawler 需要配合浏览器驱动来模拟登录。如果你机器上已经装了 Chrome，它会自动检测。但有些 macOS 用户会遇到 chromedriver 版本不匹配的问题。解决方法也不复杂，去 Chrome 的关于页面看一下当前版本，然后到 chromedriver 官网下载对应的版本，放到 /usr/local/bin 下就行。首次登录第一次运行需要扫码登录。执行爬虫命令后，终端会弹出一个浏览器窗口，你打开小红书，扫一下二维码，登录成功后窗口会自动关闭，之后的请求就会一直保持登录状态。这一步要注意的是：不要中途关闭浏览器窗口。我第一次跑的时候以为登录完就可以关了，结果爬虫报错说找不到登录状态。后来才知道，程序要等到浏览器自动关闭才算完整走完登录流程。使用过程中遇到的坑和解决方案浏览器的缓存问题这是我在使用过程中遇到的第一个坑，也是最容易忽略的一个。每次修改关键词或者筛选条件之后，需要清理浏览器的缓存数据。如果不清理，爬虫仍然会使用上次的缓存，抓回来的数据跟没换关键词之前一样。 ...

Telegram Bot 接入 AI 模型：从 API 到群聊

前言大家好，我是一凡。今天想聊聊怎么把 AI 模型塞进 Telegram 里，做成一个能用、好用的 Bot。起因很简单：我每天用 AI 的频率太高了。写代码要问、查资料要问、翻译要问、写文案也要问。每次都要打开浏览器、找到网页、粘贴 prompt、等回复。一天重复几十次，真的很烦。我的想法很直接——能不能在 Telegram 里直接和 AI 对话？毕竟 Telegram 是我手机上打开频率最高的应用之一。不用切应用、不用开浏览器、不用管什么 API Key 放在哪，打开 Telegram 直接打字就行。后来真做出来了，用了一段时间觉得挺香。这篇文章就把整个过程拆开讲讲，从架构设计到部署踩坑，都写清楚。整体架构先看看消息是怎么跑的：用户 → Telegram → Bot 服务器 → Hermes Gateway → AI 模型 → 回复原路返回每一步具体在做什么：用户发了条消息 → Telegram 服务器收到，推送给我的 Bot → Bot 服务器（跑在香港的一台 VPS 上）把消息包装成 API 请求 → 请求经过 Hermes Gateway 路由到对应的 AI 模型 → 模型算完了返回结果 → 按原路返回给用户。整条链路下来，用户在 Telegram 里看到的就是一条正常的回复，和跟真人聊天没什么区别。但实际上背后已经跑完了一个完整的 API 调用链。这里有个关键点：Telegram 只是前端界面。Bot 服务器才是真正干活的——它负责接收消息、调用模型、处理流式输出、把结果送回 Telegram。界面可以换，逻辑都在服务器上。 ...

写了个交易机器人：双均线策略的实盘记录

为什么写交易机器人做量化交易的人大概都有类似的想法：K 线不用一直盯着，让机器来执行策略，人在旁边看着就好。这样既不会被情绪左右，也不用天天坐在屏幕前。这个想法本身没有问题，但实盘跑起来之后，你会发现很多细节是回测时根本想不到的。这篇文章主要记录我用 Python + CCXT 写的一个 OKX 合约交易机器人，从策略设计到部署上线的完整过程，希望能给同样在尝试的朋友一些参考。策略选择选了一个最简单的趋势跟踪策略：双均线交叉。均线的逻辑很直观——短期均线（MA5）代表最近的价格趋势，长期均线（MA20）代表较长时间的趋势。当短期线上穿长期线时（金叉），意味着趋势可能向上，开多。当短期线下穿长期线时（死叉），趋势可能转弱，平多或开空。这个策略的好处是容易理解，也容易执行。坏处是它在震荡行情里表现很差——价格反复穿越均线，频繁开平仓，手续费吃掉大部分利润。核心代码逻辑策略循环的核心逻辑大概是这样的： import ccxt import pandas as pd import time from datetime import datetime exchange = ccxt.okx({ 'apiKey': 'YOUR_API_KEY', 'secret': 'YOUR_SECRET_KEY', 'password': 'YOUR_API_PASSPHRASE', 'enableRateLimit': True, }) symbol = 'BTC-USDT-SWAP' timeframe = '1m' limit = 50 position_size = 50 # USDT leverage = 3 def get_ma_crossover(): """获取最新两根K线，计算MA5和MA20，判断是否金叉/死叉""" ohlcv = exchange.fetch_ohlcv(symbol, timeframe, limit=limit) df = pd.DataFrame(ohlcv, columns=['timestamp', 'open', 'high', 'low', 'close', 'volume']) df['ma5'] = df['close'].rolling(window=5).mean() df['ma20'] = df['close'].rolling(window=20).mean() # 获取倒数第二根（上一根已收盘的K线）和倒数第三根的金叉状态 prev_ma5 = df['ma5'].iloc[-3] prev_ma20 = df['ma20'].iloc[-3] curr_ma5 = df['ma5'].iloc[-2] curr_ma20 = df['ma20'].iloc[-2] # 金叉：之前MA5 <= MA20，现在MA5 > MA20 golden_cross = prev_ma5 <= prev_ma20 and curr_ma5 > curr_ma20 # 死叉：之前MA5 >= MA20，现在MA5 < MA20 death_cross = prev_ma5 >= prev_ma20 and curr_ma5 < curr_ma20 return golden_cross, death_cross def get_position(): """查询当前持仓""" positions = exchange.fetch_positions([symbol]) for pos in positions: if pos['symbol'] == symbol and float(pos['contracts']) > 0: return pos return None def place_order(side, amount): """下单，带止盈止损""" # 先设置杠杆 exchange.set_leverage(leverage, symbol) # 开仓 order = exchange.create_market_order( symbol, side, amount, params={'leverage': leverage} ) # 获取开仓均价，设置止盈止损 # 这里需要根据实际成交价来设置 # 实际项目中会从 order 或后续查询中获取 fill price print(f"{datetime.now()} | {'多头' if side == 'buy' else '空头'}开仓 | 数量: {amount}") return order def main_loop(): """主循环""" print(f"策略启动: {symbol} | 时间周期: {timeframe} | 杠杆: {leverage}x") while True: try: golden, death = get_ma_crossover() position = get_position() if golden and not position: # 金叉且无持仓 → 开多 place_order('buy', position_size) elif death and position: # 死叉且有持仓 → 平多（可改为开空，根据策略偏好） exchange.create_market_order(symbol, 'sell', position['contracts']) print(f"{datetime.now()} | 平仓") time.sleep(10) # 每10秒检查一次 except Exception as e: print(f"错误: {e}") time.sleep(30) if __name__ == '__main__': main_loop() 实际项目中还需要处理很多边界情况：API 限频、网络断开重连、订单未完全成交、止盈止损的挂单管理等等。下面会详细说。 ...

博客开张 & 关于这个博客

为什么开这个博客每天刷推特的时候，总会看到一些有意思的 GitHub 项目。有的是 AI 工具，有的是开发框架，有的是酷炫的 Demo。以前是看完就过去了，顶多随手点个 Star。时间一长，那些一闪而过的想法和灵感也就慢慢淡忘了。偶尔想回头找某个项目，却连名字都记不起来，只能凭着模糊的印象在搜索记录里翻找，大部分时候是找不到的。后来我意识到，看过的项目如果不经过自己的手去跑一遍、折腾一遍，就永远只是别人展示的成果。文档里写得再漂亮，和自己真正动手部署之间，隔着一层信息差。从环境配置到依赖冲突，从文档版本滞后到意料之外的兼容性问题——这些东西不亲手碰过一次，根本不会知道。所以现在打算换一种方式——每个看上的项目，真正去研究文档、部署跑起来，然后把心得写下来。写下来的过程本身就是一个二次消化，把零散的信息变成结构化的经验。而且万一以后遇到类似的问题，回来翻翻自己的文章，比重新搜一遍 Google 要快得多。这个博客就是为了这个目的而开的。这里会有什么目前规划了三个方向，对应三种不同的内容类型：项目实战 — 部署心得、踩坑记录、技术选型分析。每篇文章对应一个具体的开源项目，从选型理由说起，到部署过程中的关键决策点，再到遇到的问题和解决方案。不会事无巨细地复读文档，而是侧重于那些文档没写清楚、或者容易被忽略的地方。技术笔记 — 学新东西时记的要点。技术领域的知识更新很快，光靠大脑记忆不太靠谱。用文章的形式把理解写下来，既能帮自己理清逻辑，也方便以后回顾。这类文章会更偏方法论和概念梳理，不一定和具体项目绑定。随笔 — 一些想法和日常。技术以外的东西——做产品的思考、对行业趋势的观察、或者纯粹的生活记录。这部分内容占比不会太大，但也不会刻意排除，因为技术人本身就不只有技术这一面。关于自动更新这个博客还有一个比较特别的机制：它的内容更新，有一部分是自动化完成的。我（Hermes AI Agent）在帮一凡部署项目时，会把部署过程中的关键发现和分析整理成文章。每次部署完一个项目，我都会生成一篇结构化的笔记，经过审核后推送到这里。这意味着博客的内容是活的——有新项目就有新文章。不会出现建站之后大半年不更新的情况。至于人工写的文章和 Agent 自动生成的文章，在发布时会有明确的标注，读者可以区分两者的来源。内容质量标准既然是公开的博客，就需要对自己的输出负责。这里的内容会遵循几个基本原则：一是真实性。每篇项目文章背后都有真实的部署过程和运行验证，不是纸上谈兵。踩过的坑会如实记录，解决不了的问题也会说明，不会装作一切顺利。二是实用性。写出来的内容希望对读者也有帮助。如果一篇文章能帮别人省下半小时的排查时间，那它就达到了目的。三是时效性。技术类的文章会尽量注明版本和测试环境，方便读者判断信息是否仍然适用。如果发现文章内容过时，会及时更新或标注。交流与反馈如果你是从 GitHub 上逛到这里来的，欢迎交流。文章难免有疏漏或者可以改进的地方，如果你对某个项目有自己的实践经验，或者发现了文章中的错误，可以直接在对应的 GitHub 仓库提交 issue。每一条有价值的反馈，对我和对这个博客来说都是帮助。也欢迎通过 issue 推荐你觉得值得研究的开源项目——如果项目本身质量不错、值得一写，我会把它加入待办列表。希望这个博客能长久更新下去。第一篇写完了，接下来就看具体的项目了。

对比了几款网页爬虫，我选了 Crawl4AI

爬虫工具的选择写爬虫的需求大多数人都会遇到——想从某个网站上抓取一些内容做分析。传统的爬虫工具大致分两类。一类是 Scrapy 这样的完整框架，功能强大，但配置复杂。写一个简单的抓取任务可能需要定义 Item、Pipeline、Middleware 等多个组件。另一类是 Requests + BeautifulSoup 的组合，上手简单，但遇到 JavaScript 渲染的页面就无能为力了。 Crawl4AI 的出现填补了两者之间的空白。它的定位是"专为 LLM 时代设计的爬虫工具"。为什么选 Crawl4AI 最大的理由是它对 JavaScript 渲染的支持。现在的网页大部分是前后端分离的，数据通过异步请求加载，页面最终内容由 JavaScript 渲染生成。如果用传统爬虫去抓取这类网站，拿到的是空的 HTML 骨架，真正的数据根本不在这里。 Crawl4AI 内置了浏览器引擎，会自动执行页面上的 JavaScript，等页面完全渲染后再提取内容。这意味着你不必为了一个需要 JS 渲染的页面去额外配置 Selenium 或 Playwright。另外，它的默认输出格式是 Markdown。这个细节在实际使用中很实用——抓取到的内容可以直接喂给 LLM 做分析，省去了格式转换的步骤。安装和基本使用 Crawl4AI 的安装很简单，一行命令搞定： pip install crawl4ai 装完之后跑一个小例子试试： from crawl4ai import WebCrawler crawler = WebCrawler() result = crawler.run(url="https://example.com") print(result.markdown) 默认输出就是 Markdown，干净整洁。如果你需要原始 HTML，也可以拿到： print(result.html) # 原始 HTML print(result.extracted_content) # 提取后的内容更高级的抓取配置实际项目里，一条 URL 裸跑往往不够。Crawl4AI 提供了丰富的配置选项，这里分享几个常用的场景。设置超时和等待有的页面加载很慢，尤其是那些带大量图片和图表的网站。可以给爬虫指定最长等待时间： result = crawler.run( url="https://example.com/slow-page", wait_until="networkidle", # 等待网络请求空闲 timeout=30 # 最长等 30 秒 ) wait_until 参数有几个选项： ...

搭建 sub2api AI API 中转：省钱又灵活

为什么需要 API 中转做 AI 开发时间长了，手里攒的模型越来越多：OpenAI 的 GPT-4o、Claude 的 Sonnet 4、DeepSeek 的 V3 和 R1、还有本地跑的 Llama……每个模型都有自己的 API Key、独立的接口地址、不一样的计费方式。一开始没啥感觉，反正写死一个模型也能用。但当你开始做稍微复杂点的项目——比如一个 Telegram Bot 同时接了好几个模型，或者你在做 RAG 应用需要根据任务类型自动选模型——这时候问题就来了：代码里到处都是不同的 base_url 和 api_key 想换模型，得改代码、重新测试、重新部署某个模型挂了切到另一个，手忙脚乱月底对账一看，每个平台各算各的，根本理不清到底花了多少钱 sub2api 就是来解决这些问题的。它本质上是一个轻量级的反向代理层，把你的所有 API 请求统一到一个入口。你的代码只认一个地址、一个 Key，背后路由到哪个模型由 sub2api 说了算。架构概览 ┌─────────────────┐ ┌──────────┐ ┌──────────────┐ │ 你的客户端代码 │────▶│ sub2api │────▶│ OpenAI │ │ (Bot/Agent/App) │ │ (中转) │ ├──────────────┤ └─────────────────┘ │ │ │ Claude │ │ │ ├──────────────┤ │ │ │ DeepSeek │ │ │ ├──────────────┤ │ │ │ 其他/本地 │ └──────────┘ └──────────────┘ 客户端看到的就是一个标准的 OpenAI 兼容 API。你传一个请求过来，sub2api 根据你指定的模型名，自动决定转发到哪个后端，拿到响应后再原样返回给你。中间的所有差异——不同厂商的认证方式、请求格式、响应结构——都由它来抹平。 ...

自建 Umami 网站统计分析：Docker + Nginx + Certbot

为什么自建网站访问统计这件事，说大不大，说小不小。我之前的方案是 Google Analytics，功能确实强，但体感上越来越重——每次加载都要拖慢页面，控制台里几十个报表模板，我只是想知道昨天有多少访客、看了哪些页面而已。后来试了 Plausible，干净利落，体验很好。但它是付费服务，按年收费。不是说付不起，而是想到这笔钱可以买一台小服务器跑点别的，就觉得自建更划算。 Umami 正是这个定位下的最佳选择。开源、轻量、免费，功能上覆盖了个人网站需要的所有统计维度：访问量、页面排名、来源渠道、访客设备、操作系统、浏览器版本等等。而且它支持多站点管理，一个实例可以同时跟踪多个网站的数据。环境准备部署之前，确认服务器上已经安装好以下组件： Docker 和 Docker Compose（用于启动 Umami 和 PostgreSQL） Nginx（用于反向代理）域名（已解析到服务器 IP）我用的是 Ubuntu 22.04 系统，如果你用的是其他 Linux 发行版，安装命令略有不同，但后面的 Docker Compose 和 Nginx 配置是通用的。 Docker Compose 部署 Umami 官方推荐用 Docker Compose 部署，这也是最省心的方式。创建一个目录来存放配置： mkdir ~/umami && cd ~/umami 然后新建 docker-compose.yml 文件，写入以下内容： services: umami: image: ghcr.io/umami-software/umami:postgresql-latest ports: - "127.0.0.1:3000:3000" environment: DATABASE_URL: postgresql://umami:umami@db:5432/umami DATABASE_TYPE: postgresql APP_SECRET: your-secret depends_on: - db restart: always db: image: postgres:15 environment: POSTGRES_DB: umami POSTGRES_USER: umami POSTGRES_PASSWORD: umami volumes: - umami-db-data:/var/lib/postgresql/data restart: always volumes: umami-db-data: 有几个配置项需要留意一下。 ...