provsql

PostgreSQL 半环溯源与不确定性管理扩展

概览

扩展包名版本分类许可证语言
provsql1.10.0FEATMITC++
ID扩展名BinLibLoadCreateTrustReloc模式
2900provsql-
相关扩展uuid-ossp

版本

类型仓库版本PG 大版本包名依赖
EXTPIGSTY1.10.01817161514provsqluuid-ossp
RPMPIGSTY1.10.01817161514provsql_$v-
DEBPIGSTY1.10.01817161514postgresql-$v-provsql-
OS / PGPG18PG17PG16PG15PG14
el8.x86_64
el8.aarch64
el9.x86_64
el9.aarch64
el10.x86_64
el10.aarch64
d12.x86_64
d12.aarch64
d13.x86_64
d13.aarch64
PIGSTY 1.10.0
PIGSTY 1.10.0
u22.x86_64
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
u22.aarch64
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
u24.x86_64
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
u24.aarch64
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
PIGSTY 1.10.0
u26.x86_64
u26.aarch64

构建

您可以使用 pig build 命令构建 provsql 扩展的 RPM / DEB 包:

pig build pkg provsql         # 构建 RPM / DEB 包

安装

您可以直接安装 provsql 扩展包的预置二进制包,首先确保 PGDGPIGSTY 仓库已经添加并启用:

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展:

pig install provsql;          # 当前活跃 PG 版本安装
pig ext install -y provsql -v 18  # PG 18
pig ext install -y provsql -v 17  # PG 17
pig ext install -y provsql -v 16  # PG 16
pig ext install -y provsql -v 15  # PG 15
pig ext install -y provsql -v 14  # PG 14
dnf install -y provsql_18       # PG 18
dnf install -y provsql_17       # PG 17
dnf install -y provsql_16       # PG 16
dnf install -y provsql_15       # PG 15
dnf install -y provsql_14       # PG 14
apt install -y postgresql-18-provsql   # PG 18
apt install -y postgresql-17-provsql   # PG 17
apt install -y postgresql-16-provsql   # PG 16
apt install -y postgresql-15-provsql   # PG 15
apt install -y postgresql-14-provsql   # PG 14

预加载配置

shared_preload_libraries = 'provsql';

创建扩展

CREATE EXTENSION provsql CASCADE;  -- 依赖: uuid-ossp

用法

来源:READMEv1.9.0 releasev1.9.0 controlgetting startedconfigurationsemirings

provsql 为 PostgreSQL 增加 semiring provenance 与不确定性管理能力。上游文档覆盖 provenance tracking、semiring evaluation、probabilities、Shapley and Banzhaf values、where-provenance、update provenance 和 temporal features。

加载并跟踪 Provenance

shared_preload_libraries = 'provsql'
CREATE EXTENSION provsql CASCADE;

如果需要,CASCADE 形式会自动安装 uuid-ossp。getting-started guide 说明 preload 步骤是必需的,因为 ProvSQL 会安装 planner hook。

SELECT provsql.add_provenance('mytable');

SELECT name, provenance()
FROM mytable;

SELECT provsql.remove_provenance('mytable');

用户文档还描述了 provenance mappings:

SELECT create_provenance_mapping('my_mapping', 'mytable', 'column_name');
SELECT create_provenance_mapping_view('my_mapping_view', 'mytable', 'column_name');

概率与影响力

为 tuple tokens 分配概率:

SELECT set_prob(provenance(), 0.8)
FROM mytable
WHERE id = 1;

SELECT name, probability_evaluate(provenance()) AS prob
FROM mytable;

计算影响力分数:

SELECT shapley(provenance(), m.token)
FROM mytable, my_mapping AS m;

SELECT banzhaf(provenance(), m.token)
FROM mytable, my_mapping AS m;

文档还描述了 shapley_all_varsbanzhaf_all_vars,用于一次性计算所有输入变量的分数。

内置 Semirings

内置 semiring 函数使用 provenance token 和 provenance mapping table:

SELECT name, sr_boolean(provenance(), 'my_mapping')
FROM mytable;

SELECT name, sr_formula(provenance(), 'my_mapping')
FROM mytable;

SELECT name, sr_how(provenance(), 'my_mapping')
FROM mytable;

当前文档包含 sr_howsr_whichsr_tropicalsr_viterbisr_lukasiewiczsr_minmaxsr_maxmin 的 compiled wrappers。对于 PostgreSQL 14 及之后版本,还包含基于 multirange values 的 sr_temporalsr_interval_numsr_interval_int

SELECT city,
       sr_minmax(provenance(), 'personnel_level',
                 'unclassified'::classification_level) AS clearance
FROM (SELECT DISTINCT city FROM personnel) AS t;

SELECT entity_id, sr_temporal(provenance(), 'validity_mapping')
FROM mytable;

高级用户仍可以定义 custom semirings,并通过 provenance_evaluateaggregation_evaluate 求值;如果已有 compiled semiring 符合所需代数,上游建议优先使用它。

额外模式与辅助函数

上游文档记录的 session GUC 包括:

SET provsql.active = on;
SET provsql.where_provenance = on;
SET provsql.update_provenance = on;
SET provsql.last_eval_method = on;
SET provsql.tool_search_path = '/opt/d4:/home/postgres/bin';
SET provsql.aggtoken_text_as_uuid = on;

provsql.tool_search_path 用于 d4c2ddsharpminic2dweightmcgraph-easy 等外部概率与可视化工具。provsql.last_eval_method 会保存上一次选用的概率求值方法。provsql.aggtoken_text_as_uuid 会让 aggregate-token 单元格显示为其 provenance UUID;agg_token_value_text(token) 可恢复这些 aggregate tokens 的显示文本。

用户指南另行记录了 where-provenance helpers、update provenance、get_valid_timetimetraveltimeslicehistoryundo 等 temporal helpers,circuit_subgraph(root, max_depth)resolve_input(uuid) 这类 circuit-inspection helpers,以及用于准备 helper search path 的 setup_search_path()

v1.9.0 查询与概率说明

Release 1.9.0 显著扩展了 provenance-aware queries 的 SQL 覆盖范围:

  • FROM 之外的 subqueries,包括 EXISTSNOT EXISTSINNOT INANYALL、row-valued IN、scalar subqueries 和 ARRAY(SELECT ...)
  • LEFTRIGHTFULL outer joins,并修正了 EXCEPTEXCEPT ALL 的 provenance;
  • aggregates 的 SQL-faithful NULL handling,以及 COUNTSUMMINMAXAVG 的精确 HAVING aggregate probabilities;
  • 通过 method catalog 和 cost chooser 选择 probability method,支持 karp-lubystopping-rulesieved-treeprobability_bounds
  • 幂等的 add_provenancecreate_provenance_mapping 调用。

该 release 移除了旧的 probability_benchmark helper。agg_token 现在为 aggregate-token expressions 提供原生 arithmetic、unary minus 和 comparison 支持。

说明

  • db/extension.csv 中的包行列出 version 1.9.0、package provsql、dependency uuid-ossp,并标注 PostgreSQL 14 到 18 支持。
  • v1.9.0 control file 设置 default_version = '1.9.0',要求 uuid-ossp,将扩展标记为 trusted,且不可 relocatable。
  • 上游文档说明 ProvSQL 已在 PostgreSQL 10 到 18 上测试;Pigsty package matrix 为 PostgreSQL 14-18。
  • provsql.update_provenance 和 multirange semirings 要求 PostgreSQL 14 或更新版本。

最后修改 2026-07-02: extension update 2026-07-02 (d4da20c)