程序=算法+数据结构。可见算法和数据结构的重要性。该课程来自 bilibili分享

一、数据结构基本概念

1、数据结构研究内容

抽象为数学模型
- 分析问题
- 提取操作对象
- 找出操作对象间关系
- 用数学语言描述
设计算法
编程、调试、运行

2、基本概念和术语

Data
数据对象
数据结构
- 逻辑结构
  - 划分方式一
    - 线性结构：线性表、栈、队列、串
    - 非线性结构：树、图
  - 划分方式二
    - 几何
    - 线性
    - 树
    - 图、网
- 物理结构（存储结构）
  - 顺序
  - 链式
  - 索引
  - 散列

3、抽象数据类型与表示

4、算法与算法分析

算法：解决问题的一种方法或一个过程
程序 = 数据结构+ 算法

1、算法特性

有穷性
确定性
可行性
输入
输出

2、算法设计要求

正确性
- 不含语法错误
- 对于几组输入得出满足条件的结果
- 对于精心选择、典型、苛刻的数据能得到满足的输出
- 一切合法输出都能得到满足的输出
可读性
- 不晦涩难懂
- 便于阅读交流，最好有注释
健壮性
- 输出非法数据会做出恰当处理
- 处理出错不会中断执行，会返回一个表示错误的值
高效性
- 最好时间空间消耗低

3、算法时间效率的度量

事前分析
- 对资源消耗低估算
- 一般只比较数量级
事后统计
- 将算法实现，测算时间空间消耗
- 缺点
  - 编写实现算法花费时间经历多
  - 实验结果依赖于计算机当前硬件，掩盖算法优劣

二、基本数据结构

1、线性结构

1、线性表(Linear List)

由 n(n≥0)个数据元素组成的有限序列
n 定义表的长度
n=0 时称为空表
数据元素只是抽象符号，具体含义在不同情况下可以不同

逻辑特征

非空线性表有且仅有一个开始节点，他没有直接前趋，仅有一个直接后继
有且仅有一个终端节点，他没有直接后继，有且仅有一个直接前趋
其余内部节点，都有且仅有一个直接前趋和一个直接后继

类型定义

抽象数据类型线性表的定义如下

基本操作

# 构造一个空的线性表L
InitList(&L)

# 销毁线性表L（初始条件：L已存在）
DestoryList(&L)

# 将线性表重置为空（初始条件：L已存在）
ClearList(&L)

# L为空返回TRUE，否则返回false（初始条件：L已存在）
ListEmpty(L)

# 返回线性表L的数据元素个数（初始条件：L已存在）
ListLength(L)

# 用e返回L中第i个数据元素（初始条件：L已存在,1 ≤ i ≤ ListLength(L)）
GetElem(L,i,&e)

# 返回L中第一个与e满足compare()的数据元素的位置，不存在就返回0（初始条件：L已存在，compare是判定函数）
LocateElem(L,e,compare())

# 若cur_e是L中的元素且不是第一个，用pre_e返回它的前驱；否则操作失败，pre_e无意义（初始条件：L已存在）
PriorElem(L,cur_e,&pre_e)

# 若cur_e是L中元素且不是最后一个，用next_e返回它的后继；否则操作失败，next_e无意义（初始条件：L已存在）
NextElem(L,cur_e,&next_e)

# 在L的第i个位置之前插入新数据元素e，L长度+1（初始条件：L已存在,1 ≤ i ≤ ListLength(L)）
ListInsert(&L,i,e)

# 删除L的第i个元素，用e返回其值，L长度-1（初始条件：L已存在,1 ≤ i ≤ ListLength(L)）
ListDelete(&L,i,&e)

# 依次对线性表每个元素调用visited()（初始条件：L已存在）
ListTraverse(&L, visited())

顺序表示和实现

定义：把逻辑上相邻的数据元素存储在物理上相邻的存储单元中
占用一片连续的存储空间
知道某个元素存储位置就可计算其他元素的存储位置

实现一

实现二

# 数组静态分配
typedef struct {
  # 具体情况具体选择ElemType
  ElemType data[MaxSize];
  int length;
}SqList;

# 数组动态分配
typedef struct{
  ElemType *data;
  int length;
}SqList;
SqList L;
# 分配内存
L.data = (ElemType*)malloc(sizeof(ElemType)*MaxSize)

实现三

知识补充

// C语言动态内存分配
// 开辟m字节地址空间，并返回这段空间的首地址
malloc(m)
// 计算变量x的长度
sizeof(x)
// 释放指针p所指变量的存储空间，即彻底删除一个变量
free(p)

// c++动态存储分配
// 申请存放T类型对象的内存空间，并依初值列表赋以初值
// return T类型指针，指向新分配的内存 or 0(失败)
new 类型T(初值列表)

// 释放指针p所指向内存，p必须是new操作返回值
delete p

// c++参数传递
// 函数调用时，参数列表的类型、个数、顺序必须一致
/*
参数传递两种方式
传值（整型、实型、字符型）
- 一般变量做参数，形参变量的值是实参变量的副本
传地址
- 指针变量(易产生错误且阅读性较差；主函数调用点处必须用变量的地址作为实参)
- 引用类型(最好，直接对实参操作，在内存中没有产生实参的副本，时空效率更高)
- 数组名(代表数组第一个元素的地址 )
*/
int i = 5;
int &j = i;
i = 7;
j是应用类型

基本操作的实现

线性表 L 的初始化(参数用引用)

销毁线性表 L

清空线性表 L

求线性表 L 的长度

判断线性表是否为空

线性表的取值(随机存取)

按值查找

插入值

删除表的元素

小结

链式表示和实现

特点

几个问题

实现一：单链表

基本操作

//初始化单链表
Status LinkList_L(LinkList &L){
  L = new LNode;
  L->next = null;
  return OK;
}

//判断链表是否为空
//判断头指针是否为空即可
int ListEmpty(LinkList L){
  //return L->next == null ? 0 : 1;
  if(L->next)
    return 0;
  else
    return 1;
}

//销毁单链表L：销毁后链表消失
//从头指针开始，依次释放宿友友节点
Status DestoryList_L(LinkList &L){
  Lnode *p; //或LinkList p
  while(L){
    p = l;
    L =L->next;
    delete p;
  }
}

//清空链表：链表仍存在，成为空链表
//依次释放所有节点，并将头节点指针域设为空
Status ClearList(LinkList &L){
  Lnode *p,*q;
  p = L->next;
  while(p){//没到尾
    q = p->next;
    delete p;
    p = q;//下一个节点为首节点
  }
  L->next = null;
  return OK;
}

//求链表长度
//从首元节点开始，依次计数所有节点
int ListLength_L(LinkList L){
  LinkList p;
  p = l->next;
  i = 0;
  while(p){
    i++;
    p = p->next;
  }
  return i;
}

//获取线性表中指定index的元素
Status GetElem_L(LinkList L,int i,ElemType &e){
  p = l->next;j = 1;
  while(p && j<1){
    p = p->next;++j;
  }
  if(!p || j>i) return ERROR; //第i个元素不存在
  e = p->data
  return OK;
}

//按值查找地址
Lnode *LocateElem_L(LinkList L,ElemType e){
  p = L->next;
  while(p && p->data != e)
    p = p->next;
  return p:
}

//在线性表L中查找值为e的数据元素的index
int LocateElem_L(LinkList L,ElemType e){
  p = L->next;j=1;
  while(p && p->data != e){
    p = p->next;
    j++;
  }
  if(p) return j;
  else return 0;
}

//在第i个节点插入值为e的新节点
Status ListInsert_L(LinkList &L,int i,ElemType e){
  p = L;j = 0;
  while(p && j < i-1) {p = p->next; j++;} //寻找第i-1个节点，p指向i-1
  if(!p || j > i-1) return ERROR;//i大于表长+1或小于1，插入位置非法
  s = new LNode;//生成新节点s
  s->data = e;//s数据域设置为e
  s->next = p->next;//将s插入l中
  p->next = s;
  return OK;
}

//删除第i个节点
Status ListDelete_L(LinkList &L,int i,ElemType e){
  p = L;j = 0;
  while(p && j < i-1) {p = p->next; ++j;} //寻找第i个节点，p指向其前驱
  if(!p->next || j > i-1) return ERROR; //删除位置不合理
  q = p->next;//临时保存被删除节点的地址以备释放
  p->next = q->next;//改变删除节点前驱节点的指针域
  e = q->data;//保存删除节点的指针域
  delete q;//释放删除节点的空间
  return OK;
}

//头插法建链表
void CreateList_H(LinkList &L,int n){
  L = new LNode;
  L->next = null;//建立一个带头节点的单链表
  for(int i = n; i > 0; --i){
    p = new LNode;//生成新节点
    cin >> p->next;
    p->next = L->next;
    L->next = p;
  }
}

//尾插法建立链表
void CreateList_R(LinkList &L,int n){
  L = new LNode;
  L->next = null;
  r = L;//尾指针指向头节点
  for(int i = 0; i < n; i++){
    p = new LNode; cin >> p->next; //生成新节点，输入元素值
    p->next = null;
    r->next = p;//插入到尾表
    r = p;//r指向新的尾节点
  }
}

循环链表

循环链表：是一种头尾相连的链表
从表中任意一节点出发均可以找到其他节点
查找比单链表更方便

两个链表合并

LinkList Connect(LinkList a,LinkList b){//假设ab均为非空单链表
  p = a->next; //p存表a头节点
  a->next = b->next->next;//b表头连接a表尾
  delete b->next;//释放b表头节点
  b->next = p;//修改指针
  return b;
}

实现三：双向链表
定义

实现四：双向循环链表
定义

一般操作

//插入
void ListInsert_Dul(DuLinkList &L,int i,ElemType e){
  //在带有头节点的的双向循环链表L中第i个位置之前插入元素e
  if(!(p = GetElemP_DuL(L,i))) return ERROR;
  s = new DuLNode;				s->data = e;
  s->prior = p->prior;		p->prior->next = s;
  s->next = p;            p->prior = s;
  return OK;
}

//双向链表的删除
void ListDelete_DuL(DuLink &L,int i,Elemtype &e){
  //删除带头节点的双抗循环链表L的第i个元素，并用e返回
  if(!(p = getElemP_DuL(L,i))) return ERROR;
  e = p->data;
  p->prior->next = p->next;
  p->next->prior = p->prior;
  free(p);
  return OK;
}

几种比较

顺序表和链表的比较

链式存储
- 优点
  - 节点空间可以动态申请和释放
  - 数据元素的逻辑次序靠节点的指针来提示，插入和删除不需要移动数据元素
- 缺点
  - 存储密度小，每个节点的指针域占用额外存储空间。数据域字节数小时，空间效率低
  - 不能随机存取

线性表的应用

线性表的合并

//线性表的合并
void union(List &a, &b){
  a_len = ListLength(a);
  b_len = ListLength(b);
  for(int i = 1; i <= b_len; i++){
    GetElem(b,i,e);
    if(!LocateElem(a,e))
      ListInsert(&a, ++a_len, e)
  }
}

//有序表合并
//顺序表实现
void MergeList_Sq(SqList a,SqList b,SqList &c){fin
  pa = e.elem;
  pb = b.elem;
  c.length = a.length + b.length;
  c.elem = new ElemType[c.length];
  pc = c.elem;
  pa_last = a.elem + a.length - 1;
  pb_last = b.elem + b.length - 1;
  while(pa <. pa_last && pb <= pb_last){
    if(*pa <= *pb) *pc++ = *pa++;
    else *pc++ = *pb++;
  }
  while(pa <= pa_last) *pc++ = *pa++;
  while(pb <= pb_last) *pc++ = *pb++;
}
//链表实现
void Mergelist_L(LinkList &a,LinkList b,LinkList &c){
  pa = a->next;pb = b->next;
  pc = c = a;//用a的头节点作为c的头节点
  while(pa && pb){
    if(pa->data <= pb->data) {pc->next = pa; pc= pa; pa = pa->next;}
    else{pc->next = pa; pc= pa; pa = pa->next;}
  }
  pc->next = pa ? pa : pb;
  delete b;
}

//多项式创建
//输入m项的系数和指数，建立多项式有序链表
void CreatePolyn(Polynomial &p,int n){
  p = new PNode;
  p->next = null;//先建立一个带头节点的单链表
  for(int i = 1; i <= n; ++i){//依次输入n个非零项
    s = new PNode;//生成新节点
    cin >> s->ceof >> s->expn;//输入系数和指数
    pre = p;//pre用于保存q的前驱，初值为头节点
    q = p->next;//q初始化，指向首元节点
    while(q && q->expn < s->expn){//找到第一个大雨输入项指数的项*q
      pre = q; q = q->next;
    }
    s->next = q;//将输入项s插入到q和其前驱节点pre之间
    pre->next = s;
  }
}

2、栈(Stack)

限定插入和删除只能在表的“断点”进行的线性表
栈(Stack)：后进先出(LIFO)，只能在表尾进行插入和删除
栈顶/栈底：Top/Base
入栈/出栈：Push/Pop

队列(Queue)：先进先出(FIFO)，

栈底作用：
1. 表达式求值
设置两个栈：一个算符栈OPTR，用于寄存运算器；操作数栈OPND，寄存运算数和运算结果
从左往右扫描每一个字符：
	if(运算数)，将其压入栈OPND
	else if 优先级：这个运算符 > OPTR栈顶运算符		入栈
	     else 从OPND弹出两个运算数，从OPTR弹出栈顶运算符进行运算，结果压入OPND
	继续处理，知道遇到结束符为止

2. 舞伴问题

类型定义

常用操作

//顺序栈各种操作
//栈表示
typedef struct {
  SElemType *base;//栈底
  SElemType *top;//栈顶
  int stackSize;//栈可用最大容量
}SqStack
//栈的初始化
Status InitStack(SqStack &s){
  s.base = new SElmType[maxsize];
  if(!s.base) exit(overflow);//分配失败
  s.top = s.base;//栈顶指向栈底
  s.stacksize = maxsiez;
  return ok;
}
//判断栈是否为空
Status StackEmpty(SqStack s){
  return s.top == s.base ? true : false;
}
//清空栈
Status ClearStack(SqStack s){
  if(s.base) s.top = s.base;
  return ok;
}
//销毁栈
Status DestoryStack(SqStack s){
  if(s.base){
    delete s.base;
    s.stacksize = 0;
    s.base = s.top = null;
  }
  return ok;
}
//入栈
Status Push(SqStack &s, SElemType e){
  if(s.top - s.base == s.stacksize)//栈满
    return ERROR;
  else *s.top++ = e；//e编程栈顶元素，栈顶上移
}
//出栈
Status Pop(SqStack &s,SElemType &e){
  if(s.base == s.top)//栈空
    return ERROR;
  else e = *--s.top;
  return ok;
}

//栈链
//头指针就是栈顶，不需要头节点，基本不存在栈满的情况，空栈相当于头指针指向空，插入和删除进在栈顶处执行
//表示
typedef struct StackNode{
  SElemType data;
  struct StackNode *next
}StackNode,*LinkStack;
LinkStack s;
//初始化
void InitStack(Linkstack &s){
  s = null;
  return ok;
}
//入栈
Status Push(LinkStack &s,SElemtype e){
  p = new Stacknode;//生成新节点p
  p->data = e;//将新节点数据域置为e
  p->next = s;//将新节点插入栈顶
  s = p;//修改栈顶指针
  return ok;
}
//出栈
Status Pop(LinkStack &s,SElemtype &e){
  if(s == null) return ERROR;
  e = s->data;
  p = s;
  s = s->next;
  delete p;
  return ok;
}
//取栈顶元素
SElemType GetTop(LinkStack s){
  if(s != null){
    return s->data;
  }
}

栈与递归

递归：若一个对象部分的包含它自己，或用它自己给自己定义，则称这个对象时递归的

1、递归定义的数学函数
阶乘函数
2、具有递归性质的数据结构
3、可递归求解的问题
Eg：迷宫问题、汉诺塔
分治法：一个较为复杂的问题，能够分解为几个相对简单的且解法相似或相同的子问题来求解

必备条件：转换为新问题、简化、有边界

//一般形式
void p(参数表){
  if(递归结束条件) 可直接求解步骤； //基本项
  else p(较小参数)；//归纳项
}
//例子：阶乘
long fact(long n){
  if(n == 0) return 1;
  else return n * fact(n - 1);
}

//单向递归：虽有一处以上的递归调用，但各次调用只和主调函数有关，相互之间参数无关，且递归语句处于算法最后
long fib(long n){
  if(n == 1 || n == 2) return 1;
  else return fib(n - 1) + fib(n - 2);
}
//转换为循环结构效率更高
long fib(long n){
  if(n == 1 || n == 2) return 1;
  else{
    long t1 = 1,t2 = 2;
    for(long i = 3; i <= n; i++){
      t3 = t1 + t2;
      t1 = t2; t2 = t3;
      return t3;
    }
  }
}

3、队列(Queue)

限定插入和删除只能在表的“断点”进行的线性表
栈(Stack)：后进先出(LIFO)，只能在表尾进行插入和删除
栈顶/栈底：Top/Base
入栈/出栈：Push/Pop

队列(Queue)：先进先出(FIFO)
应用：脱机打印输出；多用户系统分时循环分配资源；网络报文传输

类型定义

常用操作

顺序队列

typedef struct {
  QElemType *base;//初始化动态分配存储空间
  int front;//头指针
  int rear;//尾指针
}SqQueue

//初始化队列
Status Init(SqQueue &q){
  q.base = new QElmtype[maxsize];//分配空间
  if(!q.base) exit(overflow);//存储分配失败
  q.front = q.rear = 0;
  return ok;
}


//为解决上溢，引入循环队列
//循环队列求队列长度
int QueueLength(SqQueue q){
  return (q.rear - q.front + maxsize) % maxsize
}
//循环队列入队
Status EnQueue(SqQueue &q,QElemType e){
  if((q.rear + 1) % maxsize = q.front) return ERROR;//队满
  q.base[q.rear] = e;//新元素加入队尾
  q.rear = (q.rear + 1) % maxsize;//队尾指针+1
  return ok;
}
//循环队列出队
Status DeQueue(SqQueue &q, QElemType &e){
  if(q.front == q.rear) return ERROR;
  e = q.base[q.front];
  q.front = (q.front + 1) % maxsize;
  return ok;
}
//取队头元素
SElemType GetHead(SqQueue q)「
  return q.front != q.rear ? q.base[q.front] : null;

链式队列（无法估计队列长度可使用）

//链队列定义
typedef struct Qnode{
 QElmType data;
 stuct Qnode *next;
}QNode,*QuenePtr
typedef struct{
 QuenePtr front;
 QuenePtr rear
}LinkQueue

//链队列初始化
Status InitQueue(LinkQueue &q){
 q.front = q.rear=(QueuePtr)malloc(sizeof(QNode));
 if(!q.front) exit(overflow)
   q.front->next=null;
}
//销毁链队列
Status Destory(LinkQueue &p){
 while(.front){
   q.rear=->next;
   free(q.front);
   q.front=q.rear
 }
 return ok;
}
//入队
Status entry(LinkQueue &q,QElmType e){
 p = (QueuePtr)malloc(sizeof(QNode));
 if(!p) exit(overflow);
 p->data = e;p->next = null;
 q.rear->next = p;
 return ok;
}
//出队
Status Dequeue(LinkQueue &q,QElemType &e){
 if(q.front == q.rear) return error;
 p = q.front->next;
 e = p->data;
 q.front->next = p.front;
 if(q.rear==p) q.rear = q.front;
 delete p;
 return ok;
}

4、串

串（String）：零个或多个任意字符组成的有限序列
子串：串中人一个字符组成的子序列（含空串）

空格串：由一个或多个空格组成的串，与空串不同

类型定义

存储结构

//顺序存储结构
#define MAXLEN 255
typedef struct{
  char ch[MAXLEN + 1]
  int length;
}

//链式存储结构--块链结构
#define CHUNKSIZE 80
typedef struct Chunk{
  char ch[CHUNKSIZE];
  struct Chunk *next;
}Chunk

typedef struct {
  Chunk *head,*tail;
  int curlen;
}LString

运算

模式匹配算法

//目的：确定主串种所含子串第一次出现的位置
//应用：搜索引擎、拼写检查、语言翻译，数据压缩

/**
BF算法：简单匹配法，采用穷举法的思路
思路：主串第i个字符与子串第1个字符比较
		 == 继续比较后续字符
		 != 从主串下一字符起，重新与子串第一个字符比较
*/
int Index_BF(String s,String t,int pos){
  int i=pos,j=1,index=0;
  while(i <= s.length && j <= t.length){
    if(s.ch[i] == t.ch[j])	{++i;++j;}//匹配成功一次匹配下一个字符
    else {i=i-j+2;j=1;}//失败主串、子串指针回溯重新开始下一次匹配
  }
  if(j >= t,length) index = i-t.length;//返回匹配的第一个字符的下标
  else return index;
}


/**
KMP算法：较BF不用回溯，效率提高O(n+m)

*/
int KMP(char * t, char * p)
{
  int i = 0;
  int j = 0;
  while (i < strlen(t) && j < strlen(p))
  {
    if (j == -1 || t[i] == p[j])
    {
      i++;j++;
    }
    else j = next[j];
  }
  if (j == strlen(p))
    return i - j;
  else
    return -1;
}

void getNext(char * p, int * next)
{
  next[0] = -1;
  int i = 0, j = -1;
  while (i < strlen(p))
  {
    if (j == -1 || p[i] == p[j])
    {
      ++i;
      ++j;
      next[i] = j;
    }
    else
      j = next[j];
  }
}