ZhouTimeMachine
diff --git a/‎.github/workflows/ci.yml‎
Lines changed: 46 additions & 0 deletions b/‎.github/workflows/ci.yml‎
Lines changed: 46 additions & 0 deletions
diff --git a/‎.gitignore‎
Lines changed: 6 additions & 0 deletions b/‎.gitignore‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎LICENSE‎
Lines changed: 395 additions & 0 deletions b/‎LICENSE‎
Lines changed: 395 additions & 0 deletions
diff --git a/‎README.md‎
Lines changed: 11 additions & 0 deletions b/‎README.md‎
Lines changed: 11 additions & 0 deletions
diff --git a/‎docs/courses/ads-final-review.md‎
Lines changed: 125 additions & 0 deletions b/‎docs/courses/ads-final-review.md‎
Lines changed: 125 additions & 0 deletions
diff --git a/‎docs/courses/high-dim-prob/index.md‎
Lines changed: 6 additions & 0 deletions b/‎docs/courses/high-dim-prob/index.md‎
Lines changed: 6 additions & 0 deletions
diff --git a/‎docs/courses/high-dim-prob/lec1.md‎
Lines changed: 129 additions & 0 deletions b/‎docs/courses/high-dim-prob/lec1.md‎
Lines changed: 129 additions & 0 deletions
diff --git a/‎docs/courses/imgs/ads/ads_review_RBTree_complexity.png‎
13 KB b/‎docs/courses/imgs/ads/ads_review_RBTree_complexity.png‎
13 KB
diff --git a/‎docs/courses/imgs/ads/ads_review_binary_tree.png‎
60.8 KB b/‎docs/courses/imgs/ads/ads_review_binary_tree.png‎
60.8 KB
diff --git a/‎docs/courses/imgs/ads/ads_review_master_theorem.png‎
38.3 KB b/‎docs/courses/imgs/ads/ads_review_master_theorem.png‎
38.3 KB
@@ -0,0 +1,46 @@
+name: ci 
+on:
+  push:
+    branches:
+      - master 
+      - main
+permissions:
+  contents: write
+jobs:
+  deploy:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v3
+      - uses: actions/setup-python@v4
+        with:
+          python-version: 3.x
+      - run: echo "cache_id=$(date --utc '+%V')" >> $GITHUB_ENV
+      - run: sudo apt-get update
+      - run: sudo apt-get install texlive-xetex
+      - uses: actions/cache@v3
+        with:
+          key: mkdocs-material-${{ env.cache_id }}
+          path: .cache
+          restore-keys: |
+            mkdocs-material-
+      - run: pip install mkdocs-material
+      - run: pip install mkdocs-heti-plugin
+      - run: git clone https://github.com/TonyCrane/mkdocs-toolchain.git
+      - run: pip install -e mkdocs-toolchain/mkdocs-tikzautomata-plugin
+      - run: mkdir cache
+      - run: mkdocs gh-deploy --force
+      - name: Delete workflow runs for current repo
+        uses: Mattraks/delete-workflow-runs@v2
+        with:
+          token: ${{ secrets.WORK_TOKEN }}
+          repository: ${{ github.repository }}
+          retain_days: 7
+          keep_minimum_runs: 6
+
+      - name: Delete workflow runs for remote repo
+        uses: Mattraks/delete-workflow-runs@v2
+        with:
+          token: ${{ secrets.GITHUB_TOKEN }}
+          repository: 'Owner/repository'
+          retain_days: 7
+          keep_minimum_runs: 6
@@ -0,0 +1,6 @@
+.DS_Store
+.vscode
+site/
+todo/
+cache/
+tools/
@@ -0,0 +1,11 @@
+# Jianjun Zhou's Notebook
+
+Notebook made with material for mkdocs, mainly completed during the undergraduate period.
+
+[Online Documantation](https://ZhouTimeMachine.github.io/note)
+
+## Acknowledgement
+
+- [TonyCrane](https://github.com/TonyCrane)
+
+Style modified from [TonyCrane's Notebook](https://github.com/TonyCrane/note).
@@ -0,0 +1,125 @@
+# ADS Final Review
+
+!!! info "My review note before final exam of ZJU *Advanced Data Structure and Algorithm*, 2022 Spring & Summer."
+
+## Basics
+
+- binary tree
+  - perfect：完美二叉树，每一层都被完全填充<!--more-->
+  - complete：完全二叉树，除最后一层外都是完全填充，最后一层左对齐
+  - full：完满二叉树，每个结点要么两个子结点，要么没有子结点
+  - <div style="text-align:center;">
+      <img src="../imgs/ads/ads_review_binary_tree.png" alt="ads_review_binary_tree" style="zoom:67%;" />
+    </div>
+
+## Ch2. 红黑树、B+树
+
+- $h\leq 2\log(N+1)$
+  - $sizeof(x) \geq 2^{bh(x)}-1$ (全黑取等)
+  - $bh(x)\geq\frac 12h(x)$
+- 红黑插入：必插红，处理双红
+  - case 1：父叔同红，父祖换色祖上传。
+  - case 2：叔黑子内，父子旋转使子外。
+  - case 3：叔黑子外。父祖换色父旋升。
+- 红黑删除：
+  - 删红小事。0/1度的红毫无威胁。2度红，若拿来替换的是黑，则需要让该黑变成双黑结点，然后类似删黑操作即可。主要处理删黑，删黑则先使其为双黑。
+  - 兄红转兄黑。父兄换色兄旋升。（case 1）
+  - 兄黑远黑近侄红，侄兄换色侄旋升。（case 3）
+  - 兄黑远红化其黑，父兄换色兄旋升。（case 4）
+  - 兄侄全黑则兄红，黑父不当则上传。（case 2）
+- B+：根2到M，非根$\lceil M/2\rceil$到M。
+- <div style="text-align:center;">
+    <img src="../imgs/ads/ads_review_RBTree_complexity.png" alt="ads_review_RBTree_complexity" style="zoom:67%;" />
+  </div>
+
+## Ch4. 左倾堆和斜堆
+
+<div style="text-align:center;">
+  <img src="../imgs/ads/heaps.png" alt="heaps" />
+</div>
+
+- 左倾堆针对二叉堆的merge进行了改进。斜堆不需要维护npl，但是make-heap代价较大。二项堆看似没有改进，其实是斐波那契堆的铺垫，斐波那契堆成功将插入、merge都变成了o(1)。
+
+- Npl(NULL) = -1
+- 左倾堆右路径上有r个结点，则总结点数至少为$2^r-1$
+- 斜堆轻结点类似左倾堆，也受$\log N$控制
+
+## Ch5. 二项堆
+
+- 二项堆插入的均摊时间是O(1)
+- 二项堆可以通过n次插入实现均摊的线性时间
+
+## Ch7. 分治算法
+
+- 基本主定理
+  - 比较$f(N)$与$N^{\log_ba}$，取较大的量级。同量级，则$O(N^{\log_ba}\log N)$
+- <div style="text-align:center;">
+    <img src="../imgs/ads/ads_review_master_theorem.png" alt="ads_review_master_theorem" style="zoom:67%;" />
+  </div>
+- 针对有log的N量级相同情况，有
+  - <div style="text-align:center;">
+      <img src="../imgs/ads/ads_review_master_theorem_log.png" alt="ads_review_master_theorem_log" style="zoom:67%;" />
+    </div>
+  - 需要关注的只是中间情况。
+
+## Ch11. 近似算法
+
+- **polynomial-time approximation scheme (PTAS)**: 对($1+\varepsilon$)-approximation算法，固定的$\varepsilon$情况下，时间复杂度是$N$的多项式级别
+- FPTAS(F:fully)：既是$N$又是$1/\varepsilon$的多项式级别
+- Bin Packing
+  - Next Fit: 2
+  - First Fit, Best Fit: 1.7
+  - Online algorithm: 至少5/3
+  - offline - first fit decreasing: 11/9
+- **The Knapsack Problem** 
+  - greedy 策略是2-近似的
+  - DP结果为$O(n^2p_{max})$：NP
+
+## Ch12. 局部搜索
+
+- Big-improvement-flip
+  - 大于$\frac {2\varepsilon}{|V|}W(A, B)$才翻转
+  - $(2+\varepsilon)$-approximation
+  - $O(n/\varepsilon\log W)$
+- k-flip: 增大搜索邻域 - K-L启发式
+
+## Ch13. 随机化算法
+
+- Hiring problem
+  - Naive: O($NC_h+NC_i$)
+  - 随机化：$O(C_h\ln N+NC_i)$
+  - online: $k=\max\{\lceil\frac{N}{e}\rceil, \lfloor \frac Ne\rfloor\}$
+  - hire only once, 最优概率为$k/N\ln(N/k)$到$k/N\ln(N-1/k-1)$
+
+## Ch14. 并行算法
+
+- n数之和
+  - $T(n)=\log n+2, W(n)=2n$
+- 前缀和
+  - $T(n)=O(\log n), W(n)=O(n)$
+- merge
+  - $T(n)=O(\log n), W(n)=O(n)$
+- Maximum Finding
+  - 大功率跑车$T(n)=1, W(n)=O(n^2)$
+  - 双对数基本：$T(n)=O(\log\log n), W(n)=O(n\log\log n)$
+    - $T(n)\leq T(\sqrt n)+c_1, W(n)\leq \sqrt nW(\sqrt n)+c_2n$
+  - 双对数顶层改进：顶层分为$\log\log n$份
+    - $T(n)=O(h+\log\log(n/h))=O(\log\log n)$
+    - $W(n)=O(h\times(n/h)+(n/h)\log \log (n/h))=O(n)$
+  - 随机取样：$T(n)=O(1), W(n)=O(n)$，失败概率$O(1/n^c)$
+    - $n^{1/8}$中随机取样。$T=O(1), W=O(n^{7/8})$
+    - 每个$n^{1/8}$块取最大值。$T=O(1),W=O(n^{3/4}\times n^{2\times 1/8})=O(n)$
+    - 每个$n^{1/4}$块取最大值。$T=O(1),W=O(n^{1/2}\times n^{2\times 1/4})=O(n)$
+    - 取最大值。$T=O(1),W=O(n^{2\times 1/2})=O(n)$
+
+## Ch15. 外排序
+
+- k-way merge need 2k tapes, number of passes = 
+
+- $$
+  1+\lceil \log_k(N/M)\rceil
+  $$
+
+- buffer：2kinput, 2output
+
+- huffman tree
@@ -0,0 +1,6 @@
+# High-Dimensional Probability
+
+!!! info "Note taken on PKU *High-Dimensional Probability*, 2024 Fall, [Link](https://www.math.pku.edu.cn/teachers/zhzhang/hdp.html)"
+
+- [Lecture 1](lec1.md), introduction
+- ...
@@ -0,0 +1,129 @@
+# Introduction
+
+!!! info "Lecture 1, 2024.9.10, [Link](https://www.math.pku.edu.cn/teachers/zhzhang/videos/09-10.mp4)"
+
+## Overview
+
+<div style="text-align:center;">
+    <img src="../../imgs/prob/high-dim/overview.drawio.png" alt="overview" style="margin: 0 auto; zoom: 80%;"/>
+</div>
+
+在高维中，需要刻画两个重要问题：
+
+- 维数灾难 (Curse of Dimensionality)
+- 高维特性 (Surprises in High Space)
+
+用来分析的两种常用工具：
+
+- 期望 (Expectation)
+- 以高概率存在 (with high probability)
+
+研究对象：向量 -> 矩阵 -> 函数
+
+数据假设：独立同分布 (i.i.d.) -> 鞅差 (Martingale Difference) -> 马尔科夫链 (Markov Chain)
+
+教材：*High-Dimensional Probability* by Roman Vershynin
+
+推荐资料：
+
+- 统计方面：*High-Dimensional Statistics* by Martin Wainwright
+- 理论计算机：*The Probabilitic Method* by Alon and Spencer
+- 更有趣味，偏向算法设计：*Probability and Computing* by Mitzenmacher and Upfal
+
+比较 $f(n)$ 和 $g(n)$：
+
+- $f(n) = O(g(n))$：$\exists\; c > 0$, $f(n) \leqslant c g(n)$ ($n$ 足够大)
+- $f(n) = \Omega(g(n))$：$\exists\; c > 0$, $f(n) \geqslant c g(n)$ ($n$ 足够大)
+- $f(n) = \Theta(g(n))$：$\exists\; c_1, c_2 > 0$, $c_1 g(n) \leqslant f(n) \leqslant c_2 g(n)$ ($n$ 足够大)
+> 即 $f(n) = O(g(n))$ 且 $f(n) = \Omega(g(n))$
+- $f(n) = o(g(n))$：$f(n) / g(n) \to 0$ ($n \to \infty$)
+- $f(n) \sim g(n)$：$f(n) / g(n) \to 1$ ($n \to \infty$)
+
+!!! example "Example 1"
+    先声明以下基本定义与定理：对于 $z_1, z_2, \ldots, z_n \in \mathbb{R}$
+
+    - 凸组合 (convex combination)：$\sum_{i=1}^n \lambda_i z_i$, $\lambda_i\geqslant 0$, $\sum_{i=1}^n \lambda_i=1$
+    - 凸包 (convex hull)：$T\subseteq \mathbb{R}^n$, $\mathrm{conv}(T):=\{\text{convex combinations of }z_1, \cdots, z_m\in T, \forall m\in \mathbb{N}\}$
+    - Caratheodory's Theorm: 对于 $T\subseteq \mathbb{R}^n$，任意 $\mathrm{conv}(T)$ 中的点，都可以被表示为 $n+1$ 个 $T$ 中的点的凸组合
+
+    尝试证明如下定理：
+
+    !!! abstract "Theorem"
+        考虑 $T\subseteq \mathbb{R}^n$，令 $T$ 的直径和每个点都被 1 bound，即：
+
+        - 直径 (diameter) $\mathrm{diam}(T)=\sup\limits_{x, y\in T} \|x-y\|_2\leqslant 1$
+        - $\|x\|_2\leqslant 1$，$\forall x\in T$
+
+        则 $\forall x\in \mathrm{conv}(T)$，$\forall k\in \mathbb{N}^+$, 我们能够找到 $x_1, \cdots, x_k\in T$ s.t.
+
+        $$
+        \left\| x - \frac{1}{k}\sum_{i=1}^k x_i \right\|_2 \leqslant \frac{1}{\sqrt{k}}
+        $$
+
+    > 使用 $k$ 个点估计 $x$ 的误差不受空间维度 $n$ 影响，仅与 $k$ 有关
+    
+    证明思路：考虑 $k$ 个随机点 $Z_1, \cdots, Z_k\in T$，通过对这个随机变量的构造，使其满足 $\mathbb{E}\|x - 1/k \sum Z_i\|_2^2 \leqslant 1/k$，则说明存在 $Z_1, \cdots, Z_k$ 的某组采样值 $x_1, \cdots, x_k$ 满足定理要求
+
+    ??? general "Proof"
+        根据 Caretheodory's Theorm，$\forall x\in \mathrm{conv}(T)$，$\exists y_1, \cdots, Y_{n+1}\in T$，$\lambda_1, \cdots, \lambda_{n+1}\geqslant 0$，$\sum_{i=1}^{n+1}\lambda_i=1$，s.t.
+        
+        $$
+        x = \sum_{i=1}^{n+1}\lambda_i y_i
+        $$
+
+        构造随机变量 $Z$，其概率分布 $P$ 满足 $P(Z=y_i)=\lambda_i$，则
+
+        $$
+        \mathbb{E}Z = \sum_{i=1}^{n+1}\lambda_i y_i
+        $$
+
+        考虑 $k$ 个与 $Z$ 独立同分布的随机变量 $Z_1, \cdots, Z_k$，则
+
+        $$
+        \begin{aligned}
+            \mathbb{E}\left\| x - \frac{1}{k}\sum_{i=1}^k Z_i \right\|_2^2
+            &= \mathbb{E}\left\| \frac{1}{k} \sum_{i=1}^{k} (x - Z_i) \right\|_2^2 \\
+            &= \frac{1}{k^2}\mathbb{E}\left\| \sum_{i=1}^{k} (\mathbb{E}Z_i - Z_i) \right\|_2^2 \\
+            &= \frac{1}{k^2}\sum_{i=1}^{k} \mathbb{E}\left\|  Z_i - \mathbb{E}Z_i \right\|_2^2 - \frac{2}{k^2}\sum_{1\leqslant i < j \leqslant n} \underbrace{\mathbb{E}(Z_i - \mathbb{E}Z_i )^{\top} (Z_j - \mathbb{E}Z_j )}_{\mathrm{Cov}(Z_i, Z_j)} \\
+            &= \frac{1}{k^2}\sum_{i=1}^{k} \mathbb{E}\left\|  Z_i - \mathbb{E}Z_i \right\|_2^2 \\
+        \end{aligned}
+        $$
+
+        注意由于 $Z_i, Z_j$ 相互独立，$\mathrm{Cov}(Z_i, Z_j)=0$。而
+
+        $$
+            \mathbb{E}\left\|  Z_i - \mathbb{E}Z_i \right\|_2^2
+            = \mathbb{E}\|Z\|_2^2 - \|\mathbb{E}Z\|_2^2
+            \leqslant \mathbb{E}\|Z\|_2^2
+            = \sum_{j=1}^{n+1}\lambda_j \|y_j\|_2^2 
+            \leqslant \sum_{j=1}^{n+1}\lambda_j
+            = 1
+        $$
+
+        因此就有
+        
+        $$
+            \mathbb{E}\left\| x - \frac{1}{k}\sum_{i=1}^k Z_i \right\|_2^2
+            \leqslant \frac{1}{k^2} \cdot k
+            = \frac{1}{k}
+            \Rightarrow
+            \exists\: x_1, \cdots, x_k\in T, \text{s.t.} \left\| x - \frac{1}{k}\sum_{i=1}^k x_i \right\|_2 \leqslant \frac{1}{\sqrt{k}}
+        $$
+
+!!! question "作业"
+    对于 $x_1, \cdots, x_n\in \mathbb{R}^n$, $\|x_i\|_2\leqslant 1$, 考虑任意 $p_1, \cdots, p_n\in [0, 1]$, $w=p_1x_1 + \cdots + p_nx_n$
+
+    > 注意，$\sum p_i$ 不一定为 1 了
+
+    (1) 求证存在 $\epsilon_1, \cdots, \epsilon_n\in \{0, 1\}$ 使得 $v=\epsilon_1x_1 + \cdots \epsilon_nx_n$ 满足
+
+    $$
+    \|w-v\|_2 \leqslant \frac{\sqrt{n}}{2}
+    $$
+
+    (2) 找到一个复杂度为 $O(n^2)$ （或更低）的确定性算法解出可行的 $\epsilon_1, \cdots, \epsilon_n$
+
+
+Timestamp: 0:00:00-1:03:47
+
+!!! warning "本页面还在建设中"
-Original file line number
+Diff line change
@@ @@ -0,0 +1,6 @@ @@
 +.DS_Store
 +.vscode
 +site/
 +todo/
 +cache/
 +tools/