数据库索引(数据库之索引)

时间:2024/05/09 11:19:11 编辑: 浏览量:

1、索引概述

索引(index)是帮助Mysql高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。

索引的数据结构:二叉树、B-TREE、B+TREE等

索引是帮助 MySQL 高效获取数据数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查询算法,这种数据结构就是索引。

2、索引优缺点

索引是一种高效获取数据的数据结构

优点

缺点

提高数据的检索效率,降低数据库的IO成本

索引列也是要占用空间的

通过索引列对数据进行排序,降低数据排序的成本,降低cpu的消耗

索引大大提高了查询的效率,同时也降低了更新表的速度,如对表进行插入、修改、删除时,会导致索引重排序,效率降低

使用索引可以大大减少服务器需要扫描的数据量;

使用索引可以帮助服务器避免排序或者临时表;

索引是随机I/O变为顺序I/O;

3、索引语法

  • 创建索引:
    CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name (index_col_name, ...);
    如果不加 CREATE 后面不加索引类型参数,则创建的是常规索引
  • 查看索引:
    SHOW INDEX FROM table_name;
  • 删除索引:
    DROP INDEX index_name ON table_name;
-- name字段为姓名字段,该字段的值可能会重复,为该字段创建索引create index idx_user_name on tb_user(name);-- phone手机号字段的值非空,且唯一,为该字段创建唯一索引create unique index idx_user_phone on tb_user (phone);-- 为profession, age, status创建联合索引create index idx_user_pro_age_stat on tb_user(profession, age, status);-- 为email建立合适的索引来提升查询效率create index idx_user_email on tb_user(email);-- 删除索引drop index idx_user_email on tb_user;

4、索引结构

MySQL的索引是在储存引擎层实现的,不同的储存引擎有不同的储存结构,主要包含以下几种:

索引结构

描述

B+Tree索引

最常见的索引类型,大部分引擎都支持B+树索引

Hash索引

底层数据结构是用哈希表实现的,只有精确匹配索引列的查询才有效,不支持范围查询

R-Tree索引(空间索引)

空间索引是MYSAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少

Full-text(全文索引)

是一种通过建立倒排索引,快速匹配文档的方式,类似于:Lucene/solr/ES


5、索引分类

索引类型

索引类型分为:主键索引(primary key)、普通索引(key)、唯一索引(unique key)、全文索引(fulltext key)

索引储存形式

聚集索引:将数据存储与索引放到一块,索引结构的叶子节点保存了行数据

二级索引:将数据与索引分开来存储,索引结构的叶子节点关联的是对应的主键

聚集索引选取规则

  • 如果存在主键,主键索引就是聚集索引
  • 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引
  • 如果表没有主键或没有合适的唯一索引,则 InnoDB 会自动生成一个 rowid 作为隐藏的聚集索引

6、索引设计原则

最左前缀法则

如果索引关联了多列(联合索引),要遵守最左前缀法则,最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列。
如果跳跃某一列,索引将部分失效(后面的字段索引失效)。

联合索引中,出现范围查询(<, >),范围查询右侧的列索引失效。可以用>=或者<=来规避索引失效问题。

7、索引使用

索引并不是适用于任何情况,对于中型、大中型表适用,对于小型表全表扫描更高效,而对于特大型表,需要考虑分区技术

8、SQL性能分析

查看执行频次

-- 查看当前数据库的 INSERT, UPDATE, DELETE, SELECT 访问频次SHOW GLOBAL STATUS LIKE 'Com'; SHOW SESSION STATUS LIKE 'Com';--案例:show global status like 'Com___'

慢查询日志

慢查询日志记录了所有执行时间超过指定参数(long_query_time,单位:秒,默认10秒)的所有SQL语句的日志。

查看慢查询日志开关状态:show variables like 'slow_query_log';
MySQL的慢查询日志默认没有开启,需要在MySQL的配置文件(/etc/my.cnf)中配置如下信息:

# 开启慢查询日志开关slow_query_log=1# 设置慢查询日志的时间为2秒,SQL语句执行时间超过2秒,就会视为慢查询,记录慢查询日志long_query_time=2

更改后记得重启MySQL服务,日志文件位置:/var/lib/mysql/localhost-slow.log

profile

show profile 能在做SQL优化时帮我们了解时间都耗费在哪里。通过 have_profiling 参数,能看到当前 MySQL 是否支持 profile 操作:
SELECT @@have_profiling;
profiling 默认关闭,可以通过set语句在session/global级别开启 profiling:
SET profiling = 1;
查看所有语句的耗时:
show profiles;
查看指定query_id的SQL语句各个阶段的耗时:
show profile for query query_id;
查看指定query_id的SQL语句CPU的使用情况
show profile cpu for query query_id;

explain

EXPLAIN 或者 DESC 命令获取 MySQL 如何执行 SELECT 语句的信息,包括在 SELECT 语句执行过程中表如何连接和连接的顺序。

直接在select语句之前加上关键字 explain / desc

语法:EXPLAIN SELECT 字段列表 FROM 表名 HWERE 条件;

EXPLAIN 各字段含义:

● id:select 查询的序列号,表示查询中执行 select 子句或者操作表的顺序(id相同,执行顺序从上到下;id不同,值越大越先执行)
● select_type:表示 SELECT 的类型,常见取值有 SIMPLE(简单表,即不适用表连接或者子查询)、PRIMARY(主查询,即外层的查询)、UNION(UNION中的第二个或者后面的查询语句)、SUBQUERY(SELECT/WHERE之后包含了子查询)等
● type:表示连接类型,性能由好到差的连接类型为 NULL、system、const、eq_ref、ref、range、index、all
● possible_key:可能应用在这张表上的索引,一个或多个
● Key:实际使用的索引,如果为 NULL,则没有使用索引
● Key_len:表示索引中使用的字节数,该值为索引字段最大可能长度,并非实际使用长度,在不损失精确性的前提下,长度越短越好
● rows:MySQL认为必须要执行的行数,在InnoDB引擎的表中,是一个估计值,可能并不总是准确的
● filtered:表示返回结果的行数占需读取行数的百分比,filtered的值越大越好