rosetta是基于粗糙集理论框架的表格逻辑数据工具。

特点

可操作性强,便于数据浏览等

发布属性

理论框架的表格逻辑数据工具

功能

预处理等

外文名

rosetta

简介

它提供了多种数据预处理功能,如决策表补齐、决策表离散化等及其算法,同时提供了粗糙集中常见的约简和规则的获取算法,支持从数据预处理到预测和分析规则的全过程,是一个很好的粗糙集理论软件和实验平台。

2021年3月3日,据外媒 MacRumors报道,在M1 Mac上安装即将到来的macOS 11.3更新可能会导致Rosetta 2 在全球一个或多个地区被删除。[1]

rosetta

特点

Rosetta的定位是一个用于简化模型的通用型工具,而不是针对某一特定领域。

Rosetta平台的可操作性强,便于数据浏览。它的界面具有面向对象的特点,每个可操作的对象在界面上都用单独的项目表示,每个项目包含一些与上下文相关的菜单。

它的核心计算功能可用命令行执行,适用于Perl或Python代码调用。

功能

最近核心计算可能提供的一些功能:

·导入/导出

- 通过ODBC实现DBMS之间的部分整合;

- 将规则、知识最小表示(reduct)、表格、图例和其他对象转化为多种格式,包括XML,C++和Prolog。

·预处理

- 填充决策表(decision table)中缺失的数据;

- 数据属性的离散化。

·计算

- 支持监督学习和非监督学习;

- 支持用户自定义的区分概念(notions of discernibility)

- 对多种的区分性,有效的生成精确或近似的知识最小表示

- 用知识的最小表示产生if-then规则和描述模式

- 代码运行

- 支持交叉验证(cross-validation)

·后处理:

Rosetta的工作空间示意图

- 先进的知识最小表示和规则过滤功能

·验证和分析

- 合成规则在未知样本中的应用

- 生成混淆矩阵(confusion matrices)、ROC曲线和校准曲线(calibration curves)

- 根据高级质量度量,对每个规则进行评估

- 提供统计假设检验工具

·其它

- 利用容差关系(tolerance relations)进行聚类

- 计算分割(partitions)和可变精确度的近似粗糙集

- 支持随机观察取样

- 代码开源

- 完备的说明文档