Bentley-Ottmann线段求交算法

发表于 2025-10-11 更新于 2026-03-04 分类于数据结构与算法本文字数： 456 阅读时长 ≈ 2 分钟

因为很喜欢我的伪代码所以备份一下

条件

全部都是直线段
没有重合的线段
线段端点不重合
没有三条及以上线段在同一点相交

基本算法思路

事件点优先队列Q
将所有线段的端点作为事件点，分为起点和终点，按x坐标排序，若x坐标相同则按y坐标排序。使用一个红黑树存储点指针。
扫描线状态活动集S
使用一个平衡二叉搜索树来维护当前扫描线与线段，按线段在扫描线上的y坐标排序。每当扫描线经过一个事件点时，更新树的状态。

由于std::set底层不支持动态更新key值，所以自己实现了平衡搜索树。

处理事件点

//处理事件点伪代码 
while(Q非空)
 {
     弹出事件点p;
     switch(p的类型)
     {
     case 起点:
         p的关联线段l插入到S;
         if(l的上邻居与l相交)
             计算交点并插入Q;
         if(l的下邻居与l相交)
             计算交点并插入Q;
         break;
     case 终点:
         if(l的上邻居与l的下邻居相交)
             计算交点并插入Q;
         l从S中删除;
         break;
     case 交点:
         交点关联的两条线段为l1和l2;
         交换l1和l2在S中的位置;//设定交换后l1在上，l2在下
         if(l1的上邻居与l1相交)
             计算交点并插入Q;
         if(l2的下邻居与l2相交)
             计算交点并插入Q;
         break;
     }
 }

拆分线段
记录每个线段对应的事件点指针。如果数量大于2，将线段删除并拆分成多个线段，重新插入到原链表中。

剩下的是付费内容（）

Avl树

发表于 2025-10-01 更新于 2025-10-23 分类于数据结构与算法本文字数： 246 阅读时长 ≈ 1 分钟

前言

众所周知，二叉搜索树的性质是，节点的左子树键值都比节点的小，右子树键值都比节点的大。当单调增加或减少的值一一插入时，插入等时间复杂度严重退化成线性。所以我们要控制左右子树的高度差，作为平衡因子，将一次操作的时间复杂度控制在对数级内。

在实习的应用场景中，我想将一个时间复杂度高达的算法，降到，以便于给后面的算法腾出点儿时间（划掉）。查询资料，我选择了 Avl 树作为底层数据结构。接下来，我将写一个针对那个问题的c++模板类，以便于后续的更改。

（以后要不要来点酸爽的红黑树呢？）

实现

时间复杂度测试

alt text

![alt text](avltree/image-1.png)![alt text](avltree/image-2.png)

求模，求余

发表于 2025-05-12 更新于 2026-03-05 分类于数据结构与算法本文字数： 595 阅读时长 ≈ 2 分钟

%%%
计算机系统结构的GCD法引发的深思

求模与求余的区别

这是我们小学二年级就会的除法运算。

$
\begin{aligned}
5\div3&=1\cdots2\\
(-5)\div3&=(-1)\cdots(-2)\\
(-5)\div(-3)&=1\cdots(-2)\\
5\div(-3)&=(-1)\cdots2
\end{aligned}
$

好吧，我是平凡而随处可见的小学生，没学过负数……

数学定义

求模和求余的主要区别在于处理负数的方式。
首先，商的符号永远由被除数和除数一起决定。

求余操作 (a % b)：
- 余数的符号与被除数相同
- 商 = abs(a)/abs(b)*sign(a)*sign(b)
- 余数 = a-b*商 = abs(a)%abs(b)*sign(a)
求模操作 (a mod b)：
- 模的符号与除数相同
- 商 = abs(a)/abs(b)-(sign(a)*sign(b)==1?0:abs(b))
- 模 = a-b*商 = abs(abs(a)%abs(b)-(sign(a)*sign(b)==1?0:abs(b))*sign(b)

其中sign(a)为取a的正负符号,正为1，负为-1，0为0

实际对比

对于正数，两者结果相同：
对于负数，结果可能不同：

#include<bits/stdc++.h>
using namespace std;
int main() {
    //求余
    int a[]={5,-5,-5,5},b[]={3,3,-3,-3};
    for(int i=0;i<4;++i){
        cout<<a[i]<<" div "<<b[i]<<" = "<<a[i]/b[i]<<"···"<<a[i]%b[i]<<endl;
    }
    return 0;
}
//result
5 div 3 = 1···2
-5 div 3 = -1···-2
-5 div -3 = 1···-2
5 div -3 = -1···2

# 求模
a=[5,-5,-5,5]
b=[3,3,-3,-3]
for i in range(4):
    print(f'{a[i]} div {b[i]} = {a[i]//b[i]}···{a[i]%b[i]}')

# result
5 div 3 = 1···2
-5 div 3 = -2···1
-5 div -3 = 1···-2
5 div -3 = -2···-1

表格对比

表达式	求余 (C/Java)	求模 (Python)
5 % 3	2	2
-5 % 3	-2	1
-5 % -3	-2	-2
5 % -3	2	-1

转换公式

默认求模的程序语言：Python, Ruby
默认求余的程序语言：C, C++, Java, JavaScript

如果想在求余的语言中实现求模：

int mod(int a, int b) {
    int r = a % b;
    return r < 0 ? r + abs(b) : r;
}

如果想在求模的语言中实现求余：

def remainder(a, b):
    r = a % b
    if (a < 0 and b > 0) or (a > 0 and b < 0):
        return r - b
    return r

模意义下的加减乘除

$
(a+b)\bmod c=((a\bmod c)+(b\bmod c))\bmod c\\
(a-b)\bmod c=((a\bmod c)-(b\bmod c))\bmod c\\
(a\times b)\bmod c=((a\bmod c)\times (b\bmod c))\bmod c
$

但是注意，除法就不是这样的了

$
(a\div b)\bmod c=(a\times b^{-1})\bmod c=((a\bmod c)\times (b^{-1}\bmod c))\bmod c
$

$b^{-1}$是逆元

排序

发表于 2025-05-12 分类于数据结构与算法本文字数： 570 阅读时长 ≈ 2 分钟

🚧施工中🚧

排序之间的比较

排序算法	时间复杂度			空间复杂度	稳定性	适合链式存储？
排序算法	最好情况	平均情况	最坏情况	空间复杂度	稳定性	适合链式存储？
直接插入排序					✅	折半插入：❌；直接插入：✅
冒泡排序					✅	✅
简单选择排序					❌	✅
希尔排序						❌
快速排序						❌
堆排序						❌
二路归并排序					✅	✅
基数排序					✅	✅

习题

有序的排序

(没好好看题全做错了)
对 n 个基本有序的整数进行排序：

若采用插入排序算法，则时间和空间复杂度分别为（）；
若采用快速排序算法，则时间和空间复杂度分别为（）。

正确答案

插入排序：时间复杂度，空间复杂度 .
快速排序：时间复杂度，空间复杂度 .

解析

插入排序：
- 时间复杂度：当数据基本有序时，插入排序只需进行少量的比较和移动操作，因此时间复杂度为
- 空间复杂度：插入排序只需常数级的额外空间（如临时变量等），因此空间复杂度为 .
快速排序：
- 时间复杂度：快速排序在最坏情况下（如数据已完全有序），每次划分只能将数组分成一个元素和个元素的两部分，此时递归深度为，时间复杂度为 .
- 空间复杂度：快速排序主要是在原数组上进行操作，无需额外的存储空间，因此空间复杂度为 .

网络与信息安全基础知识

发表于 2025-05-12 分类于计算机网络本文字数： 1k 阅读时长 ≈ 4 分钟

这不是某大学期末考试考的东西，不要背。

信息安全

信息的特性：

密码体制和加密算法

对称加密/共享密钥
- 加密密钥与解密密钥都是用相同密钥
- 对大量明文加密时，考虑效率，一般采用对称加密
- 常用算法：AES、DES、3DES、RC-5
非对称加密/公钥加密
- 使用不同的加密密钥与解密密钥。公钥加密，私钥解密
- 常见算法：RSA、ECC、EIGamma、背包算法
流加密
- 加密和解密双方使用相同伪随机加密数据流作为密钥，明文数据每次与密钥数据流顺次对应加密，得到密文数据流
- 常见算法：RC4、ORYX、SEAL
分组加密
- 将明文分为等长的模块，使用确定的算法和对称密钥对每组分别加密解密
- 常见算法：DES、AES
数字摘要/消息摘要算法
- 一个唯一对应一个消息或文本的固定长度的值
- 单向Hash加密函数
- 常见算法：MD5、SHA、MAC

X.509数字证书推荐使用的密码算法：RSA
国密SM2数字证书采用的密码算法：ECC

数字签名与数字证书

数字签名

功能：保证信息的完整性和不可否认性。确保信息在传输过程中未被篡改，同时让接收方确认消息确实来自发送方且发送方无法否认其发送过该消息。
密钥使用 ：发送方使用自己的私钥对信息生成数字签名，接收方用发送方的公钥验证签名，验证通过则确认信息完整性和身份。

数字证书

功能：用于证明身份和确保公钥可信度。就像网络上的身份证，由权威机构颁发，验证持有者身份及公钥归属。
密钥使用 ：证书中包含公钥，证书颁发机构用自己的私钥对证书签名。接收方收到证书后，用颁发机构公钥验证证书合法性，验证通过则可安全使用证书中的公钥。

防火墙

控制进出网络的数据包和数据流向
提供流量信息的日志和审计
隐藏内部IP以及为网络结构细节
记录访问工程、包过滤、代理

在出口防火墙上配置ACL（Access Control List，访问控制列表）功能可以组织外部未授权用户访问内部网络。

防火墙三个区域，受保护程度：外网<DMZ<内网
通常把Web服务器置于DMZ区（隔离区、非军事化区）

包过滤防火墙对网络层

一些网络协议

IPsec
工作在网络层，主要用于在两台设备之间建立加密连接，保护数据传输不被窃听和篡改。常用于虚拟专用网络（VPN），让远程办公人员安全访问公司内部网络。

PPP（点对点协议）
位于数据链路层，用于在点对点链路上传输数据，比如拨号上网。它负责建立和维护连接，进行数据封装等，为上层协议提供服务。
PPP的安全协议是CHAP，密文采用MD5加密。

HTTPS
是加密版的 HTTP，在应用层工作。通过加密和身份验证，保护用户访问网站时的数据安全，比如网上购物、银行转账等场景，防止信息泄露。

TLS（传输层安全协议）
工作在传输层，是 HTTPS 的基础安全协议。用于在互联网通信中提供加密和身份验证，确保数据传输的机密性和完整性，广泛应用于各种网络应用。

未分类知识

有效防止SQL注入的手段：

对用户输入做关键字过滤
Web应用防火墙
定期扫描系统漏洞并及时修复

入侵检测技术有：专家系统、模型检测、简单匹配

知识产权与标准化基础知识

发表于 2025-05-12 分类于杂项本文字数： 344 阅读时长 ≈ 1 分钟

知识产权的分类：

$知识产权工业产权专利实用新型工业品外观设计商标服务标记厂商名称产地标记或原产地名称制定不正当竞争著作权人身权发表权署名权修改权保护作品完整权财产权使用权获得报酬权$

知识产权的特点：

无形性
双重性
确定性
独占性
地域性
- 本国法律保护
时间性

《计算机软件保护条例》保护对象：

软件程序
- 源程序
- 目标程序
文档

软件著作权无明确规定，由开发者所有。

同样的发明只能授予一项专利

专利权：谁先申请就给谁；同时申请则商量
商标权：谁先申请就给谁；同时申请，谁先使用就给谁；均未使用或者无法证明，先协商；协商不了则抽签

烟草必须注册商标

著作权时间期限

永久保护：
- 普通著作权作品的署名权、修改权、保护作品完整权
- 软件著作权的署名权、修改权
其他作品保护期限是作者终身及其死后50年
商标权可以续延长
商业秘密权保密期限不确定

My实用软件推荐单

发表于 2025-05-11 分类于杂项本文字数： 124 阅读时长 ≈ 1 分钟

普通

软件名	功能	官网
Snipaste	截图和剪贴板置顶	https://zh.snipaste.com/download.html
Color	屏幕取色板	https://www.den4b.com/news/3044/colors-3-2
ScreenToGif	Gif录屏、编辑和转换，很全面	https://www.screentogif.com/downloads
Ultimate Vocal Remover	强大的人声分离和去除混音软件	https://ultimatevocalremover.com/
OpenUtau	开源歌声合成，古法调教或鬼畜	https://www.openutau.com/#download
Joplin	多设备Markdown格式记事本	https://joplinapp.org/download/

专业

软件名	功能	官网
filezilla	ftp	https://www.filezilla.cn/
MobaXterm	ssh	https://mobaxterm.mobatek.net/
IDA	反汇编	https://hex-rays.com/ida-free

KaTex

发表于 2025-05-11 更新于 2026-03-05 分类于杂项本文字数： 1k 阅读时长 ≈ 4 分钟

数学符号

基本数学符号

符号	LaTeX 命令	符号	LaTeX 命令	符号	LaTeX 命令
±	`\pm`	∓	`\mp`	×	`\times`
÷	`\div`	√	`\sqrt`	∛	`\sqrt[3]`
!	`!`	?	`?`	∑	`\sum`
∏	`\prod`	∫	`\int`	∬	`\iint`
∭	`\iiint`	∮	`\oint`	⋃	`\bigcup`
⋂	`\bigcap`	⋁	`\bigvee`	⋀	`\bigwedge`

希腊字母

小写字母符号	小写字母LaTeX命令	大写字母符号	大写字母LaTeX命令
α	`\alpha`	Α	`\Alpha`
β	`\beta`	Β	`\Beta`
γ	`\gamma`	Γ	`\Gamma`
δ	`\delta`	Δ	`\Delta`
ε	`\epsilon`	Ε	`\Epsilon`
ζ	`\zeta`	Ζ	`\Zeta`
η	`\eta`	Η	`\Eta`
θ	`\theta`	Θ	`\Theta`
ι	`\iota`	Ι	`\Iota`
κ	`\kappa`	Κ	`\Kappa`
λ	`\lambda`	Λ	`\Lambda`
μ	`\mu`	Μ	`\Mu`
ν	`\nu`	Ν	`\Nu`
ξ	`\xi`	Ξ	`\Xi`
π	`\pi`	Π	`\Pi`
ρ	`\rho`	Ρ	`\Rho`
σ	`\sigma`	Σ	`\Sigma`
τ	`\tau`	Τ	`\Tau`
υ	`\upsilon`	Υ	`\Upsilon`
φ	`\phi`	Φ	`\Phi`
χ	`\chi`	Χ	`\Chi`
ψ	`\psi`	Ψ	`\Psi`
ω	`\omega`	Ω	`\Omega`

微积分符号

符号	LaTeX 命令	符号	LaTeX 命令	符号	LaTeX 命令
∫	`\int`	∬	`\iint`	∭	`\iiint`
∮	`\oint`	∂	`\partial`		`\frac{d}{dx}`
∇	`\nabla`	lim	`\lim`		`\infty`

集合论符号

符号	LaTeX 命令	符号	LaTeX 命令	符号	LaTeX 命令
∈	`\in`	∉	`\notin`	⊂	`\subset`
⊃	`\supset`	⊆	`\subseteq`	⊇	`\supseteq`
∩	`\cap`	∪	`\cup`	∅	`\emptyset`
Δ	`\Delta`	Φ	`\Phi`	Γ	`\Gamma`

逻辑符号

符号	LaTeX 命令	符号	LaTeX 命令	符号	LaTeX 命令
∧	`\land`	∨	`\lor`	¬	`\neg`
→	`\rightarrow`	←	`\leftarrow`	⇒	`\Rightarrow`
⇐	`\Leftarrow`	∀	`\forall`	∃	`\exists`

线性代数符号

符号	LaTeX 命令	符号	LaTeX 命令	符号	LaTeX 命令
⊕	`\oplus`	⊗	`\otimes`	⊙	`\odot`
⊥	`\perp`	∠	`\angle`	⋅	`\cdot`
∥	`\parallel`	∧	`\land`	∨	`\lor`
	`\rightharpoonup`		`\leftharpoonup`
	`A^T`		`A^{-1}`		`\operatorname{rank}`

矩阵和行列式

LaTeX 命令	LaTeX 命令	LaTeX 命令
`\begin{pmatrix}...\end{pmatrix}`	`\begin{bmatrix}...\end{bmatrix}`	`\begin{Bmatrix}...\end{Bmatrix}`
`\begin{vmatrix}...\end{vmatrix}`	`\begin{Vmatrix}...\end{Vmatrix}`
`\begin{matrix}...\end{matrix}`

其中示例中的...为a & b \\ c & d，即

&为换列
\\为换行

符号	LaTeX 命令	说明
	`\cdots`	横向省略号
	`\vdots`	纵向省略号
	`\ddots`	斜向省略号

示例：

\begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{bmatrix}

渲染效果：

其他常见符号

符号	LaTeX 命令	符号	LaTeX 命令	符号	LaTeX 命令
≈	`\approx`	≡	`\equiv`	≤	`\leq`
≥	`\geq`	≠	`\neq`	±	`\pm`
∓	`\mp`	∂	`\partial`	∇	`\nabla`

上下标和分数

符号	LaTeX 命令	符号	LaTeX 命令
	`x^2`		`y_i`
	`z^{i+1}_j`		`\frac{a}{b}`

修饰符号与上下划线

符号	LaTeX 命令	说明与示例
	`\overline{...}`	上划线，常用于表示平均值、复数共轭或线段。
	`\underline{...}`	下划线。
	`\bar{x}`	短上划线，常用于表示平均值（单字符）。
	`\vec{a}`	向量箭头（单字符或短内容）。
	`\overrightarrow{AB}`	长右箭头，常用于表示向量或有向线段。
	`\overleftarrow{BA}`	长左箭头。
	`\hat{a}`	尖角符，常用于表示单位向量或估计值（单字符）。
	`\widehat{ABC}`	宽尖角符，用于多个字符。
	`\tilde{a}`	波浪符（单字符）。
	`\widetilde{ABC}`	宽波浪符，用于多个字符。
	\dot{a}``\ddot{a}	单点、双点导数符号（如速度、加速度）。
	`\mathbf{A}`	粗体，常用于表示向量或矩阵。
	`\mathbb{R}`	黑板粗体，常用于表示数集（需`amsfonts`或`amssymb`宏包）。
	`\mathcal{F}`	花体，常用于表示集合或算子。

常用组合示例：

向量表示： (\vec{v}) 或 (\mathbf{v})
平均值： (\bar{x}) 或 (\overline{X})
估计值： (\hat{\theta})
有向线段： (\overrightarrow{AB})

箭头

LaTeX 命令	LaTeX 命令	LaTeX 命令
`\leftarrow`	`\rightarrow`	`\leftrightarrow`
`\Leftarrow`	`\Rightarrow`	`\Leftrightarrow`
`\longleftarrow`	`\longrightarrow`	`\longleftrightarrow`
`\Longleftarrow`	`\Longrightarrow`	`\Longleftrightarrow`
`\uparrow`	`\downarrow`	`\updownarrow`
`\Uparrow`	`\Downarrow`	`\Updownarrow`
`\mapsto`	`\hookrightarrow`	`\hookleftarrow`
`\rightharpoonup`	`\leftharpoondown`	`\rightleftharpoons`
`\nearrow`	`\swarrow`	`\nwarrow`
`\searrow`

关系代数

中文	符号	LATEX命令
投影	Π	`\Pi`
选择	σ	`\sigma`
重命名	ρ	`\rho`
聚合函数	G	`\mathcal{G}`
并	∪	`\cup`
交	∩	`\cap`
自然连接	⋈	`\bowtie`或`\Join`
左外连接	⟕	（直接复制吧）
右外连接	⟖	（同上）
全外连接	⟗	（同上）
笛卡尔乘积	×	`\times`
除	÷	`\div`
赋值	←	`\leftarrow`
条件并列	∧	`\land` 或 `\vee`
非	¬	`\neg`
存在	∃	`\exists`
对所有	∀	`\forall`

参考

数据库系统原理期末笔记

发表于 2025-05-11 更新于 2025-05-12 分类于数据库本文字数： 3.7k 阅读时长 ≈ 14 分钟

Not just for exam.

参考：林子雨老师的《数据库系统原理》，以及《软件设计师教程》

写在前面：刻在DNA里的学生选课数据库

本章的所有实例都以学生选课数据库为基础，该数据库包括5个表：

学生表Student(Sno, Sname, Ssex, Sage, Sdept);
课程表Course(Cno, Cname, Cpno, Ccredit);
学生选课表SC(Sno, Cno, Grade);
教师表Teacher(Tno, Tname, Tsex, Tage);
授课表TC(Tno, Cno)。

每一个表的第一列都是主码。

Student

Sno	Sname	Sex	Sage	Sdept
2024001	林书凡	男	18	MA
2024002	李欣然	女	19	IS
2024003	王武义	男	20	CS
2024004	苏文甜	女	19	CS

Course

Cno	Cname	Cpno	Ccredit
1	大数据	3	2
2	操作系统	5	4
3	数据库	5	4
4	编译原理	NULL	4
5	编程语言	NULL	2
6	数据挖掘	3	2

SC

Sno	Cno	Grade
2024001	1	97
2024001	2	78
2024001	3	86
2024002	2	85
2024002	3	77

Teacher

Tno	Tname	Tsex	Tage
97001	林形文	男	45
97002	司马鹰松	男	33
97003	王明天	男	38
97004	马晓燕	女	36
97005	张勇	男	51

TC

Tno	Cno
97001	1
97001	3
97002	2
97003	4
97004	5
97004	6
97005	6

数据库概述

关系数据库

关系运算

逻辑表达式

运算符		含义
比较运算符	>	大于
	>=	大于等于
	<	小于
	<=	小于等于
	=	等于
	<>	不等于
逻辑运算符	¬	非
	∧	与
	∨	或

八种关系运算

并（Union）：
- 符号：
- 作用：合并两个关系中的元组，去除重复的元组。
- 表示：，表示关系R和关系S的并集。
交（Intersection）：
- 符号：
- 作用：找出两个关系中共有的元组。
- 表示：，表示关系R和关系S的交集。
差（Difference）：
- 符号：
- 作用：从第一个关系中移除与第二个关系中相同的元组。
- 表示：，表示关系R中不在关系S中的元组。
选择（Selection）：
- 符号：
- 作用：从关系中选择满足特定条件的元组（行）。
- 表示： $条件$ ，表示从关系R中选择满足条件的元组。
投影（Projection）：
- 符号：
- 作用：从关系中选择特定的属性列。
- 表示： $属性列表$ ，表示从关系R中选择指定的属性列。
连接（Join）：
- 符号：
- 作用：将两个关系中满足特定条件的元组合并成一个新的关系。
- 表示：，表示关系R和关系S的自然连接。
  - 条件连接（θ-连接）：，其中是连接条件，可以是、、等比较运算符，表示基于这些条件的连接。
  - 外连接（Outer Join）：当两个关系中没有完全匹配的元组时，外连接可以返回其中一个关系的所有元组，以及另一个关系中匹配的元组。如果另一个关系中没有匹配的元组，则结果中对应的字段为NULL。
    - 左外连接（Left Outer Join）：返回左关系（R）的所有元组，即使在右关系（S）中没有匹配的元组。如果右关系中没有匹配的元组，则结果中右关系的部分为NULL。
      - 表示： $Double subscripts: use braces to clarifyR \underset{A \theta B}{\Join}_{\text{L}} S$ 或者 $⟕$
    - 右外连接（Right Outer Join）：返回右关系（S）的所有元组，即使在左关系（R）中没有匹配的元组。如果左关系中没有匹配的元组，则结果中左关系的部分为NULL。
      - 表示： $Double subscripts: use braces to clarifyR \underset{A \theta B}{\Join}_{\text{R}} S$ 或者 $⟖$
    - 全外连接（Full Outer Join）：返回两个关系中任一关系的所有元组，无论另一个关系中是否有匹配的元组。如果另一个关系中没有匹配的元组，则结果中对应的字段为NULL。
      - 表示： $Double subscripts: use braces to clarifyR \underset{A \theta B}{\Join}_{\text{FULL}} S$ 或者 $⟗$
笛卡尔积（Cartesian Product）：
- 符号：×
- 作用：将两个关系中的每个元组与另一个关系中的每个元组配对，形成所有可能的组合。
- 表示：R × S，表示关系R和关系S的笛卡尔积。
除（Division）：
- 符号：÷
- 作用：找出能够与第二个关系中所有元组配对的第一个关系中的元组。
- 表示：R ÷ S，表示关系R中能够与关系S中所有元组配对的元组。

简单理解：

选择是取行，投影是取列。
自然连接中，如果两个表有相同的列名，那两个表相同列名的列，具体值也要相同，才能配对。所以左右表都有可能会删去一些不匹配的行。
左外连接中，左边表的所有行都会被保留，即使右边表中没有匹配的行，此时右边表对应的位置会用NULL填充。
右外连接同理。
全外连接中，左右两边表的所有行都会被保留，无论是不是匹配，当有一边没有匹配时，那一边对应的位置会用NULL填充。
笛卡尔积就是两个表直接不由分说地连， $行列$ 大小的表A和 $行列$ 大小的的表B，笛卡尔积得到 $行列$ 的表C，与连接不同。
除如图：

关系运算的sql表示

并（Union）

1
2
3

SELECT column_name(s) FROM table1
UNION
SELECT column_name(s) FROM table2;

交（Intersection）

1
2
3

SELECT column_name(s) FROM table1
INTERSECT
SELECT column_name(s) FROM table2;

差（Difference）

1
2
3

SELECT column_name(s) FROM table1
EXCEPT
SELECT column_name(s) FROM table2;

选择（Selection）
1
2
SELECT * FROM table
WHERE condition;
投影（Projection）
1
SELECT column_names FROM table;

连接（Join）

自然连接（Natural Join）

1 2	SELECT * FROM table1 NATURAL JOIN table2;

条件连接（θ-连接）

1 2	SELECT * FROM table1 JOIN table2 ON condition;

外连接（Outer Join）

左外连接（Left Outer Join）

1 2	SELECT * FROM table1 LEFT JOIN table2 ON condition;

右外连接（Right Outer Join）

1 2	SELECT * FROM table1 RIGHT JOIN table2 ON condition;

全外连接（Full Outer Join）

1 2	SELECT * FROM table1 FULL JOIN table2 ON condition;

笛卡尔积（Cartesian Product）
1
SELECT * FROM table1, table2;

除（Division）

SELECT column_names FROM table1
WHERE NOT EXISTS (
    SELECT * FROM table2
    WHERE table1.column = table2.column
);

习题

学生数据库

已知数据库

学生表S(Sno, Sname, Ssex, Sage, Sdept);
课程表C(Cno, Cname, Cpno, Ccredit);
学生选课表SC(Sno, Cno, Grade);

完成：

检索选修课程名为“数学”的学生的学号和姓名。
检索至少选修了课程号为 1 和 3 的学生的学号。
检索选修了“操作系统”或“数据库”课程的学生的学号和姓名。
检索年龄在 18～20 之间（含 18 和 20）的女生的学号、姓名及年龄。
检索选修了“数据库”课程的学生的学号、姓名及成绩。
检索选修了全部课程的学生的姓名所在系。
检索选修课程包括 1042 学生所学课程的学生的学号。
检索不选修 2 课程的学生的姓名和所在系。

My answer：
~~打latex也太难了吧，我直接开始歪歪地手写~~

关系数据库标准语言SQL

视图在数据字典中保存的是视图定义

关系数据库编程

关系数据库安全和保护

关系数据库的规范化理论

关系模式中可能存在的冗余和异常问题

数据冗余
不一致性
插入异常
删除异常
函数依赖
定义
函数依赖：设为任一给定关系，如果对于中属性的每一个值，中的属性只有唯一值与之对应，则称函数决定，或函数依赖于 X，记作。其中，X 称为决定因素。反之，对于关系中的属性和，若不能函数决定 Y，则其符号记作。
平凡的函数依赖：设是一个函数依赖，若，则称是一个平凡的函数依赖。
完全函数依赖：设是一个函数依赖，并且对于任何，都不成立，则称是一个完全函数依赖，记作。
部分函数依赖：设是一个函数依赖，但不是完全函数依赖，则称是一个部分函数依赖，记作。
传递函数依赖：设是一个关系模式，，，，如果，，且，，，则称 传递函数依赖于，。
候选码：设为任一给定关系模式，为其所含的全部属性集合，为的子集，若有完全函数依赖，则为的一个候选码。
主属性和非主属性：包含在任何一个候选码中的属性为主属性，否则为非主属性。

理解

普通函数依赖（X→Y）
想象你的身份证号码（X）就像一把万能钥匙，它能直接确定你的姓名（Y）、性别、出生地。只要知道身份证号，其他信息都能唯一确定。
例如：学号→姓名，就像每个学号对应唯一的学生。
平凡依赖 vs 非平凡依赖
- 平凡就像「已知父亲名字，自然知道家族姓氏」（因为姓氏已经是父亲名字的一部分）
- 非平凡像「快递单号与包裹信息」，单号能唯一确定收件人的电话（例如单号 SF123456 对应电话 13800001111），但电话不是单号的子集，这也是非平凡函数依赖
完全依赖 vs 部分依赖
完全依赖就像「用完整钥匙开锁」：
- 成绩完全依赖（学号+课程号）组合，单独学号或课程号都不够
部分依赖像「用半截钥匙就能开锁」：
- 如果课程名称只依赖课程号（而课程号是主键的一部分），就是部分依赖
传递依赖（连锁反应）
学号→系号→系主任，系主任像被「间接遥控」确定。这会导致数据冗余（多个学生重复存储系主任信息）

候选码就像「能开所有锁的最小钥匙组合」：
- 比如（学号+课程号）组合才能确定成绩，单独一个都不行
主属性是所有候选码中的零件：
- 如果候选码是学号，那么学号就是主属性；如果候选码是（学号+身份证号），两者都是主属性

范式

第一范式（1NF）

如果关系模式的每一个属性对应的域值都是不可再分的，称模式属于第一范式，记作。若数据库模式中的每个关系模式都是，则数据库模式。

最基本的要求，就是表中的每个属性都不可再分。例如，学生信息表中，每个学生的姓名、年龄、性别等都是不可再分的。

第二范式（2NF）

如果关系模式，并且每个非主属性都完全函数依赖于的码，则。

不能有部分依赖。例如，在选课表中，学生成绩应该依赖于学号和课程号的组合，而不是单独依赖学号或课程号。

第三范式（3NF）

关系模式 R 中若不存在这样的码、属性组及非主属性，使得、和成立，则称。

例如，学生表中的成绩不能依赖于学生的姓名，因为姓名不是码。

Boyce-Codd范式(BCNF)

若，而且R中没有任何属性传递函数依赖于R中的码，则关系模式。

第四范式（4NF）

了解一下就可以了。

第五范式（5NF）

了解一下就可以了。

理解

1NF（基础版）
要求：每个字段都是最小单元，不能拆。
错误示范：把「联系电话」写成 “13800001111,13800002222”（应拆分成多行）
2NF（消灭半吊子依赖）
必须消灭部分依赖。比如选课表中：
- 错误：把课程名称和成绩都放在同一张表（课程名称只依赖课程号，不依赖学号）
- 正确：拆分成「选课表（学号+课程号+成绩）」和「课程表（课程号+课程名称）」
3NF（斩断连锁依赖）
禁止传递依赖。比如学生表里直接存系主任名字：
- 错误：学生表包含系号→系主任
- 正确：拆分成「学生表（学号+系号）」和「院系表（系号+系主任）」
BCNF（加强版3NF）
连主属性都不能有传递依赖。举个极端例子：
- 假设每个老师只教一门课，每门课有多个老师
- 错误表：（老师ID，课程）主键是老师ID，但课程→教室（课程不是主键）
- 正确：拆分成「老师-课程表」和「课程-教室表」

举个综合例子（学生选课系统）：
原始混乱表
| 学号 | 姓名 | 课程号 | 课程名 | 成绩 | 系名 | 系主任 |
|—-|—-|—-|—-|—-|—-|—-|
| 001 | 张三 | C01 | 数学 | 90 | 计算机系 | 李主任 |

问题分析：

课程名只依赖课程号（违反2NF）
系主任依赖系名，系名依赖学号（传递依赖，违反3NF）

助记小漫画（但是记的可能不是数据库知识点）

</details>

规范化后：

学生表（学号，姓名，系名）3NF
课程表（课程号，课程名）2NF
选课表（学号，课程号，成绩）2NF
院系表（系名，系主任）3NF

这样修改后，更新系主任信息只需要修改院系表中的一个位置，避免了数据冗余和更新异常。

模式分解

习题

2021上半年软考 42题

给定关系R（U,F），其中U={A,B,C,D,E,H}，F={(A→B,B→DH,A→H,C→E)}。关系有（），F中（）。

问题1：

[ ] A. 1个候选码A
[ ] B. 2个候选码A、B
[x] C. 1个候选码AC
[ ] D. 2个候选码A、C

问题2：

[ ] A. 不存在传递依赖，但存在冗余函数依赖
[ ] B. 既不存在传递依赖，也不存在冗余函数依赖
[ ] C. 存在传递依赖A→D和A→H，但不存在冗余函数依赖
[x] D. 存在传递依赖A→D和A→H，并且还存在冗余函数依赖

Python偷懒行为图鉴

发表于 2025-05-10 分类于 Python 本文字数： 843 阅读时长 ≈ 3 分钟

算法

日期题: datetime

日期差值填空

众所周知，2025 年是完全平方年，因为。
定义一个年份是完全平方年当且仅当存在一个正整数使得。
今天是 2025 年 3 月 29 日，现在我们想知道距离下一个完全平方年的 1 月 1 日还有几天（即从 2025 年 3 月 29 日 0 时到下次完全平方年的 1 月 1 日 0 时，例如：从 3 月 29 日 0 时到 3 月 30 日 0 时算 1 天）。

from datetime import datetime as dt
a=dt(2025,3,29,0,0,0)
b=dt(46**2,1,1,0,0,0)
print((b-a).days)

P10385 [蓝桥杯 2024 省 A] 艺术与篮球

小蓝决定根据日期的笔画数来安排自己的练习。首先，他会将当天的日期按照 YYYYMMDD 的格式
转换成一个位数，然后将这位数对应到汉字上，计算这些汉字的总笔画数。如果总笔画数超过，他就去练习篮球；如果总笔画数不超过，他就去练习书法。
例如，在年月日这天，日期可表示为一个位数字，其转换为汉字是“二零二四零一零一”。日期的总笔画数为，因此在这天，小蓝会去练习书法。
以下是汉字的笔画数对照表：

汉字	笔画数	汉字	笔画数
零		五
一		六
二		七
三		八
四		九

现在，请你帮助小蓝统计一下，在年月日到年月日
这段时间内，小蓝有多少天是在练习篮球？

from datetime import datetime,timedelta
a=datetime(2000,1,1,0,0,0)
b=datetime(2024,4,13,0,0,0)
c=a
d=timedelta(days=1)
bh=[13,1,2,3,5,4,4,2,2,2]
s=0
def cnt(x,n):
    ret=0
    for i in range(n):
        ret+=bh[x%10]
        x//=10 # 注意python除法
    return ret

while c<=b:
    s+=1 if cnt(c.year,4)+cnt(c.month,2)+cnt(c.day,2)>50 else 0
    c+=d

print(s)

大数/高精度题: decimal

最高位之和

$2\times 5=10$

对于正整数，设为在十进制下的最高非零位的值，为在十进制下的最高非零位的值，求所有可能的作为的值的和。相同的值只计算一次。

from decimal import Decimal
two=Decimal('2')
five=Decimal('5')
s=set()
def high(x):
    while x>9:
        x//=10
    return x

for i in range(50000):
    try:
        s.add(high(two)*high(five))
        two*=2
        five*=5
        # print(two,five)
    except Exception as e:
        # print(str(e))
        break
res=0
for i in s:
    res+=i
print(res)

对拍

待测程序

待测程序test.cpp

#include<bits/stdc++.h>
using namespace std;
int main()
{
    freopen("input.txt","r",stdin);
    freopen("output1.txt","w",stdout);
    //待测程序
    return 0;
}

对拍程序

对拍程序bl.cpp

#include<bits/stdc++.h>
using namespace std;
int main()
{
    freopen("input.txt","r",stdin);
    freopen("output2.txt","w",stdout);
    //待测程序
    return 0;
}

Python简易评测机

没用过，先放一个在这儿
python简易对拍

import os
import random
import subprocess
import time
import filecmp

def test():
    with open("input.txt", "w") as f:
        '''
        生成随机数据，例
        n = random.randint(1, 100)
        f.write(f"{n}\n")
        for _ in range(n):
            l = random.randint(1, 100)
            r = random.randint(1, 100)
            f.write(f"{l} {r}\n")
        '''
    start_time=time.time()
    subprocess.run(["test.exe"], shell=True) # 测试
    print(f"用时{time.time()-start_time:.3f}s")
    subprocess.run(["bl.exe"], shell=True) # 对拍
    return filecmp.cmp("output1.txt", "output2.txt")

random.seed(time.time())
for i in range(100): # 测试数量
    print(f"运行测试例 {i}...")
    if not test():
        print("测试例 {i} 失败")
        exit(0)
print("通过")

参考：https://blog.csdn.net/Mibbp/article/details/124012372