PostgreSQL 另类advisory lock保证唯一约束法说明

帮
助
中
心

网站公告

新闻动态

域名注册

虚拟主机

企业邮箱

数据库

云服务器

备案指南

mssql数据库问题

首页 » 帮助中心 » 数据库 » mssql数据库问题

PostgreSQL 另类advisory lock保证唯一约束法说明

发布日期：2016-4-26 21:4:35

　　在没有唯一约束或者主键约束时，数据库是不保证唯一性的。那么有什么手段来保证呢?

　　方法 1. 串行操作，先查询，如果没有查到记录，那么插入。

　　这种方法效率非常的低：

　　测试如下所示：

　　postgres=# create table tbl(c1 text);

　　CREATE TABLE

　　postgres=# create index idx_c1 on tbl(c1);

　　CREATE INDEX

　　postgres=# create or replace function load(v_c1 text) returns void as $$

　　declare

　　begin

　　perform 1 from tbl where c1=v_c1 limit 1;

　　if found then

　　return;

　　else

　　insert into tbl(c1) values (v_c1);

　　end if;

　　end;

　　$$ language plpgsql strict;

　　CREATE FUNCTION

　　压测：

　　vi test.sql

　　\setrandom c1 1 50000

　　select load(:c1);

　　pgbench -M prepared -n -r -P 1 -f test.sql -c 1 -j 1 -T 100

　　性能分析，由于以上方法只能在串行模式下保证C1字段的唯一性，如果是并行模式，那么无法保证唯一性。所以性能完全仰仗load函数的RT，有效插入性能差，无效插入则依赖查询的RT，性能相对较好。

　　在60秒的时候，数据已经满5万了，所以都变成了无效插入，即查询后直接return。

　　progress: 59.0 s, 375.0 tps, lat 2.673 ms stddev 1.113

　　progress: 60.0 s, 368.0 tps, lat 2.713 ms stddev 1.110

　　progress: 61.0 s, 5787.1 tps, lat 0.172 ms stddev 0.521

　　progress: 62.0 s, 12538.1 tps, lat 0.079 ms stddev 0.012

　　progress: 63.0 s, 12802.2 tps, lat 0.077 ms stddev 0.011

　　验证约束准确性：

　　postgres=# select count(*),count(distinct c1) from tbl;

　　count | count

　　---------+---------

　　50000 | 50000

　　(1 row)

　　性能趋势：

　　方法2. advisory lock

　　和秒杀场景的方法是一样的(PostgreSQL秒杀一条记录能达到23万的qps。)：

　　本例一样使用advisory lock，当锁冲突时，并行会话变成串行会话，其他没有冲突会话都是并行执行的。

　　我们来看看性能会提升多少?

　　postgres=# create or replace function load(v_c1 text) returns void as $$

　　declare

　　begin

　　perform 1 from tbl where c1=v_c1 limit 1;

　　if found then

　　return;

　　end if;

　　if ( pg_try_advisory_xact_lock(hashtext(v_c1)) ) then

　　perform 1 from tbl where c1=v_c1 limit 1;

　　if not found then

　　insert into tbl(c1) values (v_c1);

　　else

　　return;

　　end if;

　　else

　　return;

　　end if;

　　end;

　　$$ language plpgsql strict;

　　压测500万唯一值。

　　vi test.sql

　　\setrandom c1 1 5000000

　　select load(:c1);

　　52个并发：

　　pgbench -M prepared -n -r -P 1 -f test.sql -c 52 -j 52 -T 100

　　越来越快，因为无效插入越来越多。如果全变成无效插入，理论上qps也是能达到20万以上的。

　　progress: 96.0 s, 161872.6 tps, lat 0.319 ms stddev 0.429

　　progress: 97.0 s, 161766.4 tps, lat 0.319 ms stddev 0.387

　　progress: 98.0 s, 164232.7 tps, lat 0.315 ms stddev 0.419

　　progress: 99.0 s, 165476.5 tps, lat 0.312 ms stddev 0.405

　　progress: 100.0 s, 166866.0 tps, lat 0.309 ms stddev 0.410

　　transaction type: Custom query

　　scaling factor: 1

　　query mode: prepared

　　number of clients: 52

　　number of threads: 52

　　duration: 100 s

　　number of transactions actually processed: 12510348

　　latency average: 0.414 ms

　　latency stddev: 0.450 ms

　　tps = 125034.429736 (including connections establishing)

　　tps = 125043.765999 (excluding connections establishing)

　　statement latencies in milliseconds:

　　0.003204 \setrandom c1 1 5000000

　　0.410254 select load(:c1);

　　验证结果，并发唯一，bingo。

　　postgres=# select count(*),count(distinct c1) from tbl;

　　count | count

　　---------+---------

　　4593181 | 4593181

　　(1 row)

　　性能趋势：

　　应用场景举例

　　比如说：

　　tbl

　　(internal_id int serial8 primary key, nick_name text unique, ......)

　　internal_id 对应的是内部使用的唯一ID

　　nick_name 是用户的唯一ID，也是唯一的。

　　用户会输入一个nick_name，然后通过序列生成内部ID。

　　如果一开始就有这样的约束，问题就不存在了。

　　但是当以前使用的数据没有加唯一约束，然后已经有重复值产生了。

　　现在想把唯一约束建立起来，首先要去重复，然后再建立唯一约束。

　　在建立唯一约束前，如果用户还有数据不断录入，并且需要不中断业务的情况下去重复和建立约束的话，有什么好办法呢?

　　办法：

　　先不管历史值，新进来的值使用以上方法保证唯一。

　　然后去重

　　再并行添加唯一索引。

　　代码举例如下所示：

　　postgres=# drop table tbl;

　　DROP TABLE

　　postgres=# create table tbl(internal_id serial8, nick_name text);

　　CREATE TABLE

　　postgres=# create index idx_tbl_nickname on tbl(nick_name);

　　CREATE INDEX

　　postgres=# drop function load(text);

　　DROP FUNCTION

　　postgres=# create or replace function load(v_c1 text) returns int8 as $$

　　declare

　　i int8;

　　begin

　　select internal_id into i from tbl where nick_name = v_c1 limit 1;

　　if found then

　　return i;

　　end if;

　　LOOP

　　if ( pg_try_advisory_xact_lock(hashtext(v_c1)) ) then

　　select internal_id into i from tbl where nick_name = v_c1 limit 1;

　　if not found then

　　insert into tbl(nick_name ) values (v_c1) returning internal_id into i ;

　　return i;

　　else

　　return i;

　　end if;

　　end loop;

　　end;

　　$$ language plpgsql strict;

　　压测500万唯一值。

　　vi test.sql

　　\setrandom c1 1 5000000

　　select load(:c1);

　　52个并发：

　　pgbench -M prepared -n -r -P 1 -f test.sql -c 52 -j 52 -T 100

　　验证数据唯一性：

　　postgres=# select count(*),count(distinct nick_name) from tbl;

　　count | count

　　---------+---------

　　3966568 | 3966568

　　(1 row)

　　性能趋势：

　　[参考]

　　1. http://blog.163.com/digoal@126/blog/static/16387704020158149538415/

上一条: Redis 3.2.0 RC3

下一条: postgresql 聚合操作

相关问题		热门问题
MYSQL的随机查询 PostgreSQL 的秒杀场景优化 PostgreSQL的流式实时统计应用 PostgreSQL的黑科技 PostgreSQL 作为图数据库存储引擎深度解析OceanBase Mongodb与Mysql的优缺点 MongoDB 的指南 PostgreSQL 9.5新特性 SQL 语句 Where 1=1 and 在 ...		Navicat批量导出数据库表到Excel表格... Redis的简介与数据类型存储深度解析OceanBase PrestoDB在京东的应用实践三种 NoSQL 数据库的比较关于RDS MySQL IOPS 使用率高的原... 阿里巴巴高级技术专家沈春辉：选择HBase是一... 通过Mysql-Front客户端解决虚拟主机D... redis cluster的使用经验造成RDS for mysql 有时出现CPU...

新手上路		支付方式	快速通道		服务与支持
域名常见问题	主机常见问题	在线支付	域名信息查询	备案信息查询	帮助中心
邮箱常见问题	云服务器问题	线下汇款	域名控制面板	主机控制面板	网络违法举报
数据库问题	备案问题		万网代备案系统		互联网不良信息举报

业务QQ： 11611616 673768899 673768855		联系电话： 023-61066666 66887777 89082222
离线联系： 13452888882 13452888883 13452888886		备案专线： 023-60887777 备案专员QQ：673768866
联系地址：重庆市九龙坡区石桥铺一城精英国际40层17号 Copyright © 重庆典名科技有限公司 023dns.com All Rights Reserved