PostgreSQL OLTP高并发请求性能优化说明

帮
助
中
心

网站公告

新闻动态

域名注册

虚拟主机

企业邮箱

数据库

云服务器

备案指南

mssql数据库问题

首页 » 帮助中心 » 数据库 » mssql数据库问题

PostgreSQL OLTP高并发请求性能优化说明

发布日期：2016-4-29 17:4:38

　　在多核系统中，一般TPS会随并发数的增加而提升，但是当并发数超过一定的数值(如CPU核数的2到3倍以后)，性能就开始下降，并发数越高，下降就越严重。

　　举例说明：

　　更新500万记录表中的1条随机记录。开8000个并发。

　　create table test_8000 (id int primary key, cnt int default 0);

　　insert into test_8000 select generate_series(1,5000000);

　　vi t.sql

　　\setrandom id 1 5000000

　　update test_8000 set cnt=cnt+1 where id=:id;

　　update test_8000 set cnt=cnt+2 where id=:id;

　　每次加载80个并发，循环100次，一共加载8000个并发。如下所示：

　　vi test.sh

　　#!/bin/bash

　　for ((i=0;i<100;i++))

　　sleep 1;

　　pgbench -M simple -n -r -f ./t.sql -c 80 -j 80 -T 100000 -U postgres &

　　done

　　开始

　　. ./test.sh

　　当连接数达到8000后，观察TPS，我们可以使用PG的统计信息表来计算QPS。如下所示：

　　postgres=# select count(*) from pg_stat_activity;

　　count

　　-------

　　8002

　　(1 row)

　　postgres=# select timestamptz '2015-10-08 17:01:24.203089+08' - timestamptz '2015-10-08 17:01:16.574076+08';

　　?column?

　　-----------------

　　00:00:07.629013

　　(1 row)

　　postgres=# select 43819090-43749480;

　　?column?

　　----------

　　69610

　　(1 row)

　　postgres=# select 69610/07.629013;

　　?column?

　　-----------------------

　　9124.3782124896103860

　　(1 row)

　　8000个并发的时候，更新TPS约9124。大部分时间可能浪费在CPU调度上了。

　　另一种场景，

　　如果有8000个并发是空闲连接，只有10个在执行更新，性能是这样的：

　　先制造8000个空闲连接：

　　vi test.sql

　　select pg_sleep(100000);

　　vi test.sh

　　#!/bin/bash

　　for ((i=0;i<100;i++))

　　sleep 1;

　　pgbench -M simple -n -r -f ./test.sql -c 80 -j 80 -T 100000 -U postgres &

　　done

　　. ./test.sh

　　postgres=# select count(*) from pg_stat_activity;

　　count

　　-------

　　8002

　　(1 row)

　　然后开启10个连接执行更新操作。如下所示：

　　pgbench -M prepared -n -r -f ./t.sql -P 1 -c 10 -j 10 -T 1000 -U postgres postgres

　　progress: 1.0 s, 29429.2 tps, lat 0.336 ms stddev 0.109

　　progress: 2.0 s, 28961.1 tps, lat 0.343 ms stddev 0.114

　　progress: 3.0 s, 30433.8 tps, lat 0.326 ms stddev 0.103

　　progress: 4.0 s, 29597.1 tps, lat 0.336 ms stddev 0.114

　　progress: 5.0 s, 28714.1 tps, lat 0.346 ms stddev 0.117

　　progress: 6.0 s, 28319.0 tps, lat 0.351 ms stddev 0.121

　　progress: 7.0 s, 28540.0 tps, lat 0.348 ms stddev 0.118

　　progress: 8.0 s, 29408.9 tps, lat 0.338 ms stddev 0.111

　　progress: 9.0 s, 29178.1 tps, lat 0.340 ms stddev 0.119

　　progress: 10.0 s, 29146.9 tps, lat 0.341 ms stddev 0.118

　　progress: 11.0 s, 27498.5 tps, lat 0.361 ms stddev 0.123

　　这种方法的性能约6万 qps。

　　优化思路如下所示：

　　排队处理用户请求。类似pgbouncer或Oracle的shared server机制，真实处理请求的进程数有限。

　　使用PostgreSQL的advisory函数可以模拟这种排队机制：

　　create or replace function upd(l int,v_id int) returns void as $$

　　declare

　　begin

　　LOOP

　　if pg_try_advisory_xact_lock(l) then -- 只有获得这个应用级锁才执行更新，否则就等待。

　　update test_8000 set cnt=cnt+1 where id=v_id;

　　update test_8000 set cnt=cnt+2 where id=v_id;

　　return;

　　else

　　perform pg_sleep(30*random()); -- 随机等待时间

　　end if;

　　END LOOP;

　　end;

　　$$ language plpgsql strict;

　　增加一个随机变量l，用来表示应用所的号码，也就是说模拟10个同时在更新的操作，其他的都在等待。

　　这个是没有经过优化的排队机制，因为不是独立的进程处理用户请求，依旧是backend process在处理用户请求，依旧有8000个进程。

　　vi t.sql

　　\setrandom id 1 5000000

　　\setrandom l 1 10

　　select upd(:l, :id);

　　vi test.sh

　　#!/bin/bash

　　for ((i=0;i<100;i++))

　　sleep 1;

　　pgbench -M simple -n -r -f ./t.sql -c 80 -j 80 -T 100000 -U postgres &

　　done

　　. ./test.sh

　　测试结果比较理想，已经提升了1倍性能。

　　postgres=# select now(),n_tup_upd+n_tup_hot_upd from pg_stat_all_tables where relname='test_8000';

　　now | ?column?

　　-------------------------------+-----------

　　2015-10-08 19:06:37.951332+08 | 221045069

　　(1 row)

　　postgres=# select now(),n_tup_upd+n_tup_hot_upd from pg_stat_all_tables where relname='test_8000';

　　now | ?column?

　　------------------------------+-----------

　　2015-10-08 19:07:46.46325+08 | 222879057

　　(1 row)

　　postgres=# select timestamptz '2015-10-08 19:07:46.46325+08' - timestamptz '2015-10-08 19:06:37.951332+08';

　　?column?

　　-----------------

　　00:01:08.511918

　　(1 row)

　　postgres=# select 222879057-221045069;

　　?column?

　　----------

　　1833988

　　(1 row)

　　postgres=# select 1833988/68.5;

　　?column?

　　--------------------

　　26773.547445255474

　　(1 row)

　　模拟结果，相比不排队，有1倍以上的性能提升。

　　TOP

　　top - 19:09:37 up 119 days, 3:59, 2 users, load average: 0.96, 0.98, 1.01

　　Tasks: 8872 total, 5 running, 8866 sleeping, 1 stopped, 0 zombie

　　Cpu(s): 5.3%us, 0.8%sy, 0.0%ni, 93.9%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

　　Mem: 132124976k total, 118066688k used, 14058288k free, 316752k buffers

　　Swap: 2097144k total, 148k used, 2096996k free, 63702028k cached

　　advisory lock是PG提供的一种轻量级的面向用户的锁(当然比LWLOCK是要重的)，我之前在秒杀场景的优化中也有叙述，可以达到每秒处理19万次的单条记录更新请求的性能，并且保持1毫秒以内的RT。请参考。

　　http://blog.163.com/digoal@126/blog/static/16387704020158149538415/

　　把这种优化思路加入到PostgreSQL的内核中是比较靠谱的，最终实现的效果会和Oracle的shared server非常类似。

　　阿里云PG内核组的小鲜肉与老腊肉们，优化开始搞起吧。

　　在没有优化前，还是使用pgbouncer这种连接池吧。

　　[参考]

　　1. http://blog.163.com/digoal@126/blog/static/16387704020158149538415/

上一条: PostgreSQL查看DB中trigger的方法

下一条: SQL Server 2016使用查询存储进行性能调优

相关问题		热门问题
MYSQL的随机查询 PostgreSQL 的秒杀场景优化 PostgreSQL的流式实时统计应用 PostgreSQL的黑科技 PostgreSQL 作为图数据库存储引擎深度解析OceanBase Mongodb与Mysql的优缺点 MongoDB 的指南 PostgreSQL 9.5新特性 SQL 语句 Where 1=1 and 在 ...		Navicat批量导出数据库表到Excel表格... Redis的简介与数据类型存储深度解析OceanBase PrestoDB在京东的应用实践三种 NoSQL 数据库的比较关于RDS MySQL IOPS 使用率高的原... 阿里巴巴高级技术专家沈春辉：选择HBase是一... 通过Mysql-Front客户端解决虚拟主机D... redis cluster的使用经验造成RDS for mysql 有时出现CPU...

新手上路		支付方式	快速通道		服务与支持
域名常见问题	主机常见问题	在线支付	域名信息查询	备案信息查询	帮助中心
邮箱常见问题	云服务器问题	线下汇款	域名控制面板	主机控制面板	网络违法举报
数据库问题	备案问题		万网代备案系统		互联网不良信息举报

业务QQ： 11611616 673768899 673768855		联系电话： 023-61066666 66887777 89082222
离线联系： 13452888882 13452888883 13452888886		备案专线： 023-60887777 备案专员QQ：673768866
联系地址：重庆市九龙坡区石桥铺一城精英国际40层17号 Copyright © 重庆典名科技有限公司 023dns.com All Rights Reserved