avatar
Articles
114
Tags
52
Categories
8

Home
Archives
Tags
Categories
About
Yuchen You
Search
Home
Archives
Tags
Categories
About

Yuchen You

7. mini-vpn-go Phase2 明文 IP-in-UDP 隧道
Updated2026-05-31|network•vpn•go
个人项目 mini-vpn-go(用户态 VPN,从零手写、逐 phase 演进,最终对标 WireGuard)的第二阶段理解笔记。 这一阶段不碰任何加密,目标只有一个:把"读 TUN → 发 UDP → 写 TUN"这条数据通路真正打通,让两台命名空间隔离的主机能 ping 通隧道地址。 源码:~/Desktop/tun_example/phase2/(仓库名是 tun_example,但 Go module 是 github.com/1WesleyYou/mini-vpn-go)。 0. 一句话本质 一个 VPN,机械地看,就是把两个读写循环用两个 goroutine 粘在一起:一个 TUN 设备 + 一个 UDP socket。 TUN 设备 = 内核给用户态开的一个"假网卡"。往里写一个 IP 包,内核会当成从真网卡收到的包来处理;从里读,拿到的是内核本来要发出去的整包 IP 报文。 UDP socket = 把那个 IP 包原封不动塞进 UDP 载荷,发给对端的公网地址。 两个搬运方向各跑一个 goroutine,互不阻塞。 ...
Tree of Thought: 不再是 left-to-right 单向思维架构
Updated2026-05-26|agentsys|agentsys•reasoning•planning
📝 概念别名 thought: 一个"思考单元", 不是单 token, 也不是一整道解, 而是介于两者之间的中间步骤; state sss: 输入 + 当前已有的 thought 序列 [z1,z2,…,zi][z_1, z_2, \dots, z_i][z1​,z2​,…,zi​]; thought generator G(pθ,s,k)G(p_\theta, s, k)G(pθ​,s,k): 在 state sss 下产生 kkk 个候选下一步 thought; state evaluator V(pθ,S)V(p_\theta, S)V(pθ​,S): 给一组 state 打分, 用来指导搜索; 为什么需要 Agent Planning 单纯 CoT 把推理当作"一条链", 一旦中间某一步走错就没机会回头, 也没法在多个候选方案之间挑最好的; 对于需要 explore, lookahead, backtrack 的任务 (数学求解, 写作规划, 字谜填空), 我们需要让 LM 不止一次地, 沿着多条路径思 ...
0. 从 Minimax 到 MCTS - 经典博弈树搜索基础
Updated2026-05-26|agentsys|agentsys•search•mcts•reinforcement_learning
📝 博弈树搜索黑称 game tree (博弈树): 把所有可能走法画成的有根树, 每个 node 是 state, 每条 edge 是 action zero-sum game: 一方 gain = 另一方 loss, 两边目标完全对立 Minimax: 假设对手最优时自己能保证拿到的最佳 outcome Alpha-Beta Pruning: Minimax 的剪枝加速版 MCTS (Monte Carlo Tree Search): 用随机采样 + 统计估计替代完整树搜索 UCT (Upper Confidence bounds for Trees): MCTS 的 Selection 阶段公式 rollout / playout / simulation: 从 leaf 出发 random play 到终局, 拿 1 个 noisy sample Markov property: 给定当前 state, 未来跟历史无关 — MCTS / minimax 都依赖这个 为什么要写这一篇 读 LATS (Language Agent Tree Sea ...
Unix 电源管理
Updated2026-05-26|os|os•unix•power-management•acpi
状态机心智模型 任何 sleep / lock / logout / hibernate 操作, 本质都是在调 4 个开关的不同组合; 判断"这个操作干了什么"只要看这 4 件事: 用户进程还在不在? (Chrome, IDE, SSH 连接是否还活着); CPU 还在不在执行指令?; RAM 还通不通电?; 磁盘上有没有内存镜像? (用来还原的); 对照表 (从轻到重) 操作 用户进程 CPU RAM 磁盘镜像 唤醒/恢复 功耗 典型场景 熄屏 (DPMS) 跑 跑 通电 — 瞬间 (动鼠标) 省 ~10W (只关显示器) 短暂离开几分钟 锁屏 (lock) 跑 跑 通电 — 输密码 同平时 离开座位防别人乱碰 Suspend (S3 / s2idle) 冻结 停 自刷新通电 — 1-3s 电池 1-3%/小时 合盖, 临时离开 Hibernate (S4) 冻结 停 断电 整块写到 swap 10-30s 0 过夜, 长时间不用 Hybrid sleep 冻结 停 通电 同时写盘 RAM 没掉就秒开, 掉了从盘恢复 1-3%/小 ...
ReAct + Reflexion - Reasoning Acting and Verbal Reinforcement Learning
Updated2026-05-21|agentsys|agentsys•llm_agent•reasoning•tool_use•reflection•self_improvement
[!联读黑称 / 术语速查] ReAct 协议: thought: 模型自言自语写出的 reasoning trace, 不出现在环境里 action: 模型对外发出的工具调用 / 环境指令, 会被执行 observation: 工具或环境返回给模型的下一段输入 trajectory: thought →\rightarrow→ action →\rightarrow→ observation →\rightarrow→ thought →\rightarrow→ … 的整条交替序列 act-only: 没有 thought, 只对外发 action 的 baseline (WebGPT, SayCan 那一派) CoT-only: 全程在脑子里推, 不调外部工具的 baseline (Wei et al. 2022) Reflexion 协议: Actor: 真正生成 action 的 policy LM, 在 Reflexion 实验里基本就是套了一层 ReAct 协议的 GPT Evaluator: 产生 reward signal 的判官, 可以是 ground-tru ...
Vpn from WireGuard Impl
Updated2026-05-20|network|network•vpn•security
VPN 史前简介 VPN 这个名字里的 virtual 来自 1990 年代企业的实际诉求, 当时跨地办公要靠租用专线, 业界想用便宜的公网 Internet 模拟出专线效果, virtual 是说虚拟出一根原本要靠物理拉线才有的专网; 接下来 30 年里, VPN 的主流协议大致经过三代: IPsec (1998, IETF), 工作在 IP 层, 由 ESP (加密 + 认证), AH (只认证), IKE (密钥协商) 三个子协议拼成; 内核态实现, 算法可协商, 规范文档加起来几千页, 配置极其复杂, 但靠厂商生态吃下了企业 site-to-site 市场; Linux 内核里对应的模块叫 XFRM; OpenVPN (2001, James Yonan), 用户态实现, 复用 OpenSSL 和 TLS 做加密认证, 用 tun / tap 接管网络, 跑 UDP 1194 或 TCP 443; 部署只要一个二进制, 跨平台友好, 是 2000s 到 2010s 商业 VPN (NordVPN 等) 的默认协议; 但用户态架构和 TLS overhead 让它性能输给下一代 ...
Onion - Identifying Incident-indicating Logs for Cloud Systems
Updated2026-05-20|agentsys|agentsys•rca•log_analysis•cloud_incidents
📝 术语别名 II-log: Incident-Indicating Log, 真正能告诉你故障在哪的那批 log; Log clique: 一组高度相似 / 频繁共现的 log template, 是 Onion 聚类的产物; Anomalous server: incident 时段触发了 alert 或 metric 异常的实例; Normal server: 同服务下未受影响的同伴实例; Bilateral: 双边对比, 这里指 anomalous 集 vs normal 集的对比; 前置: 为什么 raw log 不能直接喂给 RCA 系统 云服务一次 incident 的 log 量级通常是百万到亿条, 真正与故障有因果关系的可能只有几十条; 中间夹着大量噪声: routine heartbeat; 健康探针 (GET /health 200); 周期性 batch / cron 任务的常规 log; 跨实例都有的全局事件 (版本 reload, 集群配置 push); 上下游服务的非关键 warning; 如果直接把全量 log 倒给 ...
RCACopilot - Automatic Root Cause Analysis via Large Language Models for Cloud Incidents
Updated2026-05-20|agentsys|agentsys•rca•cloud_incidents•llm
📝 术语别名 RCA: Root Cause Analysis, 根因分析, 找到事故的真正起因; OCE: On-Call Engineer, 轮值工程师, 收到告警的那个人; Handler: 一段事先写好的诊断流程, 由 OCE 编写, 系统按 alert 类型匹配执行; Diagnostic Information: handler 收集到的所有运行时证据 (logs / metrics / traces / configs 等); CoT: Chain-of-Thought, 让 LLM 先一步步推理再下结论的 prompt 技巧; In-context Learning / Few-shot: 在 prompt 里给 LLM 几条相似历史例子作为参考; 前置: cloud incident RCA 是个什么问题 云服务一旦出事 (latency 飙高、error rate 飙升、磁盘炸了、配置错了), 监控系统会在毫秒到秒级吐出一条 incident 警报, 然后人接手: OCE 起夜接到 page; 翻 dashboard, 看 met ...
MemGPT - Towards LLMs as Operating Systems
Updated2026-05-20|agentsys|agentsys•llm_inference•memory_management
[!MemGPT 的 OS 类比词典] main context: LLM 的 context window, 类比物理 RAM external context: 向量库 / 关系库 / 日志, 类比 disk function call: 模型主动触发的 I/O, 类比 system call queue manager: FIFO 驱逐器, 类比 page replacement policy heartbeat: 定时唤醒, 类比 timer interrupt Context Window 的硬上限 现有商用 LLM 每次 forward 能看到的 token 数是有限的, 比如 GPT-4 turbo 是 128K, Llama-2-chat 是 4K; 一旦 input + output 超出这个窗口, 后续内容要么被截断, 要么只能靠外部检索 (classic RAG) 在推理前硬塞进去; 这带来两个根本问题: 长对话: session 时间够长后, 早期轮次会被挤出窗口, 模型彻底"忘"掉用户之前说过的事实 长文档分析: 单份文档已经接近 ...
ZeRO - memory optimizations toward training trillion parameter models
Updated2026-05-20|mlsys
📝 并行理论的黑称 Vertical Split: 竖切, PP Horizontal Split: 横切, TP 消耗显存的模块分类 Part Category Included Items Description 1 Model states optimizer states, gradients, parameters For large models, the majority of the memory is occupied by model states. 2 Residual states activation, temporary buffers, unusable fragmented memory The remaining memory is consumed by residual states. Model State 不足分析 + ZeRO-DP 性能 Parallelism Method Why Compute Efficiency Is High / Low Why Memory Effi ...
12…12
avatar
Yuchen You (Wesley)
Articles
114
Tags
52
Categories
8
Follow Me
Announcement
This is my Blog
Recent Post
7. mini-vpn-go Phase2 明文 IP-in-UDP 隧道2026-05-31
Tree of Thought: 不再是 left-to-right 单向思维架构2026-05-26
0. 从 Minimax 到 MCTS - 经典博弈树搜索基础2026-05-26
Unix 电源管理2026-05-25
ReAct + Reflexion - Reasoning Acting and Verbal Reinforcement Learning2026-05-21
Categories
  • agentsys6
  • cs_basic25
  • cybersecurity12
  • eecs2817
  • math9
  • mlsys4
  • network1
  • os1
Tags
unix reinforcement_learning distributed_sys gc llm security kernel memory_management icmp algorithm operating_system reflection cloud_incidents memory log_analysis ml_training rca reasoning search virtual_machine computability container os system_failure p_np tool_use cyber_security Consensus chaos_system sql pl acpi power-management cuda jvm gpu structure vpn computer_composition llm_inference
Archives
  • May 202613
  • April 20263
  • March 20262
  • January 20261
  • December 20254
  • November 20253
  • October 20255
  • September 202516
Info
Article :
114
UV :
PV :
Last Update :
©2020 - 2026 By Yuchen You (Wesley)
Framework Hexo|Theme Butterfly
welcome to my blog!
Search
Loading the Database