数据库索引(数据库之索引)

时间：2024/05/09 11:19:11 编辑：浏览量：次

1、索引概述

索引（index）是帮助Mysql高效获取数据的数据结构（有序）。在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引。

索引的数据结构：二叉树、B-TREE、B+TREE等

索引是帮助 MySQL 高效获取数据的数据结构（有序）。在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查询算法，这种数据结构就是索引。

2、索引优缺点

索引是一种高效获取数据的数据结构

优点	缺点
提高数据的检索效率，降低数据库的IO成本	索引列也是要占用空间的
通过索引列对数据进行排序，降低数据排序的成本，降低cpu的消耗	索引大大提高了查询的效率，同时也降低了更新表的速度，如对表进行插入、修改、删除时，会导致索引重排序，效率降低

使用索引可以大大减少服务器需要扫描的数据量；

使用索引可以帮助服务器避免排序或者临时表；

索引是随机I/O变为顺序I/O；

3、索引语法

创建索引：
CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name (index_col_name, ...);
如果不加 CREATE 后面不加索引类型参数，则创建的是常规索引
查看索引：
SHOW INDEX FROM table_name;
删除索引：
DROP INDEX index_name ON table_name;

-- name字段为姓名字段，该字段的值可能会重复，为该字段创建索引create index idx_user_name on tb_user(name);-- phone手机号字段的值非空，且唯一，为该字段创建唯一索引create unique index idx_user_phone on tb_user (phone);-- 为profession, age, status创建联合索引create index idx_user_pro_age_stat on tb_user(profession, age, status);-- 为email建立合适的索引来提升查询效率create index idx_user_email on tb_user(email);-- 删除索引drop index idx_user_email on tb_user;

4、索引结构

MySQL的索引是在储存引擎层实现的，不同的储存引擎有不同的储存结构，主要包含以下几种：

索引结构	描述
B+Tree索引	最常见的索引类型，大部分引擎都支持B+树索引
Hash索引	底层数据结构是用哈希表实现的，只有精确匹配索引列的查询才有效，不支持范围查询
R-Tree索引（空间索引）	空间索引是MYSAM引擎的一个特殊索引类型，主要用于地理空间数据类型，通常使用较少
Full-text（全文索引）	是一种通过建立倒排索引，快速匹配文档的方式，类似于：Lucene/solr/ES

5、索引分类

索引类型

索引类型分为：主键索引（primary key）、普通索引(key)、唯一索引(unique key)、全文索引(fulltext key)

索引储存形式

聚集索引：将数据存储与索引放到一块，索引结构的叶子节点保存了行数据

二级索引：将数据与索引分开来存储，索引结构的叶子节点关联的是对应的主键

聚集索引选取规则：

如果存在主键，主键索引就是聚集索引
如果不存在主键，将使用第一个唯一(UNIQUE)索引作为聚集索引
如果表没有主键或没有合适的唯一索引，则 InnoDB 会自动生成一个 rowid 作为隐藏的聚集索引

6、索引设计原则

最左前缀法则

如果索引关联了多列（联合索引），要遵守最左前缀法则，最左前缀法则指的是查询从索引的最左列开始，并且不跳过索引中的列。
如果跳跃某一列，索引将部分失效（后面的字段索引失效）。

联合索引中，出现范围查询（<, >），范围查询右侧的列索引失效。可以用>=或者<=来规避索引失效问题。

7、索引使用

索引并不是适用于任何情况，对于中型、大中型表适用，对于小型表全表扫描更高效，而对于特大型表，需要考虑分区技术

8、SQL性能分析

查看执行频次

-- 查看当前数据库的 INSERT, UPDATE, DELETE, SELECT 访问频次SHOW GLOBAL STATUS LIKE 'Com'; SHOW SESSION STATUS LIKE 'Com';--案例：show global status like 'Com___'

慢查询日志

慢查询日志记录了所有执行时间超过指定参数（long_query_time，单位：秒，默认10秒）的所有SQL语句的日志。

查看慢查询日志开关状态：show variables like 'slow_query_log';
MySQL的慢查询日志默认没有开启，需要在MySQL的配置文件（/etc/my.cnf）中配置如下信息：

# 开启慢查询日志开关slow_query_log=1# 设置慢查询日志的时间为2秒，SQL语句执行时间超过2秒，就会视为慢查询，记录慢查询日志long_query_time=2

更改后记得重启MySQL服务，日志文件位置：/var/lib/mysql/localhost-slow.log

profile

show profile 能在做SQL优化时帮我们了解时间都耗费在哪里。通过 have_profiling 参数，能看到当前 MySQL 是否支持 profile 操作：
SELECT @@have_profiling;
profiling 默认关闭，可以通过set语句在session/global级别开启 profiling：
SET profiling = 1;
查看所有语句的耗时：
show profiles;
查看指定query_id的SQL语句各个阶段的耗时：
show profile for query query_id;
查看指定query_id的SQL语句CPU的使用情况
show profile cpu for query query_id;

explain

EXPLAIN 或者 DESC 命令获取 MySQL 如何执行 SELECT 语句的信息，包括在 SELECT 语句执行过程中表如何连接和连接的顺序。

直接在select语句之前加上关键字 explain / desc

语法：EXPLAIN SELECT 字段列表 FROM 表名 HWERE 条件;

EXPLAIN 各字段含义：

● id：select 查询的序列号，表示查询中执行 select 子句或者操作表的顺序（id相同，执行顺序从上到下；id不同，值越大越先执行）
● select_type：表示 SELECT 的类型，常见取值有 SIMPLE（简单表，即不适用表连接或者子查询）、PRIMARY（主查询，即外层的查询）、UNION（UNION中的第二个或者后面的查询语句）、SUBQUERY（SELECT/WHERE之后包含了子查询）等
● type：表示连接类型，性能由好到差的连接类型为 NULL、system、const、eq_ref、ref、range、index、all
● possible_key：可能应用在这张表上的索引，一个或多个
● Key：实际使用的索引，如果为 NULL，则没有使用索引
● Key_len：表示索引中使用的字节数，该值为索引字段最大可能长度，并非实际使用长度，在不损失精确性的前提下，长度越短越好
● rows：MySQL认为必须要执行的行数，在InnoDB引擎的表中，是一个估计值，可能并不总是准确的
● filtered：表示返回结果的行数占需读取行数的百分比，filtered的值越大越好