Mysql架构图解读

2024-08-14 09:05 数据库作者： it_lihongmin

一、Server层

1、连接器

连接器主要负责与Mysql客户端建立连接，权限认证，维持和管理链接。

当开始连接服务器时需要使用账号、密码登录服务器，执行命令：

mysql -h $ip -P $port -u $root -p $password

如果用户名验证不通过则会报错：Access denied for user；成功则继续调用权限表，获取用户权限信息，存储到类似本地线程变量中，后续分析器、优化器中会使用。当给当前用户权限进行修改后，自己需要重新登录才能获取新的权限信息，类似我们自己写权限相关代码时，会将权限、角色等相关信息存储到线程本地变量 ThreadLocal 中。

当与服务器建立链接后，我们可以使用 show processlist； 命令查看当前链接到服务器的客户端链接信息，如果status为sleep等状态表示处于空闲状态。记得自己刚开始开发项目时，客户端没有配置好，服务器请求量很低，特别是晚上，第二天来就会看到报错：Lost connection to MySQL server during query。就是在连接器模块报错的，服务端配置 wait_timeout 可以设置客户端再次请求时，判断是否超时，为8小时。

与服务器端的链接分为长链接和短连接。短连接本身每次都会执行TCP的三次握手和四次挥手，并且建立链接后会进行认证和权限相关的操作，我们需要防止客户端并发量递增时对服务器端的短连接风暴。现在开发项目Mysql客户端基本都基于线程池实现，线程本身是复用的长链接，长链接的弊端是会在服务端线程内部存储大量的查询缓存等信息，只有断开链接时才会释放。所以最好是使用长链接的同时，当执行了比较大的事务之后，手动断开链接，释放资源。在 5.7版本之后，mysql增加了mysql_reset_connection参数可以将链接初始化到刚刚创建链接时的状态，我们可以在长事务或者定时执行该操作。

2、缓存模块

缓存模块是一直比较弊病的模块，在 Mysql 8之后已经废弃掉了。由于查询时根据整个sql进行hash计算，我们知道hash计算哪怕原字符有一个标点不同那么hash值也完全不同，所以一定要sql一模一样才能匹配缓存。

但是整个表只要有一点修改操作就会将所有缓存进行删除，即可能费了很大的力气进行缓存，但是还没执行缓存查询就被删除了。

所以缓存只适用于配置表等基本不会变动的数据，但是个人理解，随着Redis等旁路缓存的普及，基于所有的项目都有缓存，那么数据库的缓存弊病多使用。

query_cache_type 设置为 off/on 缓存是否开启；
query_cache_size = 0：缓存大小，可以设置如：128M；
也可以将 query_cache_type 设置为：DEMAND，在需要缓存时显示调用，如： select SQL_CAHCE * from table where id = 100;

3、分析器（分析需要做什么）

读执行的sql进行词法和语法分析，词法分析需要解析如select是一个查询语句，查询的具体表名，查询的条件等；语法分析如 sql字符串是否符合sql规范，是否符合Mysql 自己的sql规范等。

一般遇到的

you have an error in your SQL syntax use near...

就是在该模块报出的。

4、优化器（分析怎么做）

优化器主要负责索引的选择、多表关联时的 join 顺序，这些都具体在后面专门进行分析。

5、执行器（执行过程）

执行器负责具体调用底层的存储引擎接口，处理数据。

rows_examined调用底层引擎接口查询的条数或次数，有可能这里调用一次叠加一次，但是内部可能查询了多行数据。

二、存储引擎层

常用的存储引擎有InnoDB、MyISAM、Memory，现在很多公司的数据库规范直接规定创建表只能使用 InnoDB，不仅仅是因为支持事务，还与运维时候的数据http://www.devze.com备份等相关。

在 Mysql 5.5后，将默认的存储引擎从 MyISAM变更为 InnoDB，只是个人还是比较喜欢或者建议在创建表时，显示设置存储引擎 engine = Innodb。

Memory引擎作为临时表的默认存储引擎，当执行复杂sql或数据量比较大需要使用临时表；或者我们自己手动基于临时表实现业务时，都会用到Memory存储引擎，所以还是需要关注的。

存储引擎需要关注具体的数据结构：

Mysql架构图解读

InnoDB只支持B+树的数据结android构，而Memory引擎支持B+树和Hash索引。

B+树支持快速的读写，并且时间复杂度为O(logN)，支持区间查询。

Hash索引读写的时间复杂度近似O(1)，比较适合内存中使用，不支持区间查询编程。

三、查询流程

select name from table_1 where email = 'XXX'; // 比如该表使用 innoDB引擎

1、【连接器】先使用长链接或者短链接，使用用户名和密码进行登录操作；
2、【连接器】执行上面的select语句，到连接器；
3、【缓存模块】判断是否有开启缓存，或者要查询缓存，有查询完成后需要回执缓存；
4、【解析器】检查sql的词法、语法分析，是否sql有问题；
5、【优化器】判断是否有索引，是否需要进行优化等（这里没有join等操作）；

email无索引：

6、【执行器】、调用innoDB引擎接口获取表的第一条数据，判断 eamil是否相等，如果是则放入结果集中，叠加器rows_examined++
7、【执行器】、重复执行上面的动作，一直到表的最后一行
8、【执行器】、将结果集返回给客户端

email有索引：（之前一直以为是innoDB直接返回了所有满足条件的结果集给执行器）

6、【执行器】、调用InnoDB的满足条件的第一行数据，内部查询走索引
7、【执行器】、获取满足条件的下一行
8、【执行器】、返回结果集

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程客栈(www.devze.com)。

继续阅读：Mysql架构图

Mysql架构图解读

目录

一、Server层

1、连接器

2、缓存模块

3、分析器（分析需要做什么）

4、优化器（分析怎么做）

5、执行器（执行过程）

二、存储引擎层

三、查询流程

总结

更多精彩内容

精彩评论

最新数据库

MySQL主键与外键的基本概念与作用详解

MySQL数据类型详解

Redis事务处理的实现示例

如何查看Navicat已保存的数据库连接密码详解

MySQL企业版数据脱敏与去标识化的方法详解

数据库排行榜

Hadoop Key Management Server (KMS)配置及测试

spark报错ERROR ObjectStore: Version information found in metastore differs 2.1.0 from expected schema version 1.2.0. Schema verififcation is disabled hive.metastore.schema.verification so setting version.

Navicat连接Oracle数据库的详细步骤与注意事项

解决Navicat远程连接MySQL出现 10060 unknow error的方法

redis-cluster集群调优之cluster-require-full-coverage参数