从数据元构成看广义集合(兼论“个”的分辨原则)

关键词 数据元,特性词,对象词,个体分                                          

欧阳余山 2007,5,26

从数据元构成看张学文老师的广义集合(兼论“个”的分辨原则)

最近为某油田搞数据中心建设,结合项目又钻研了一番数据元命名的国家标准,居然发现与张老师定义的广义集合有很多联系。但细想起来也不奇怪,张老师曾专门论述过表格语言与广义集合之间的关系,而数据中心(数据库)全部建立在表格语言上,它们的联系就有必然性。表格语言的表达基础单元就是数据元,所以结合数据元的国家标准来释义和彰显广义集合在表达方面的普遍意义,可能是一个很好的途径。如果说心有多大舞台就有多大,那么表格语言有多通用则广义集合的表达就有多通用。

张老师在他的《组成论》中谈到:
广义集合是把集合概念中的元素概念一分为二而形成的。元素概念中本体性的部分被称为个体,元素概念中外观性的部分被称为标志。我们这种称谓在语义上是比较妥切的,但是它们把集合论中的惯用的元素一词给扔掉了。这可能使人们感到不便。如何处理名称问题也是要大家商量研究的。

下面再看表格语言的表达方式:
一般讲,一个数据元就是表格语言中的一个数据项。它的一般构成法则是:
数据元=对象词+特性词+表示词
对象词比如是学生,就是广义集合中的元素,在没有进行特征描述时,它们是平等的,但可以分辨出个来。

特性词就是广义集合中的标志,比如性别就是一个标志词,在数据元里称为特性词。特性总是某个对象的特性,比如上例是学生的性别,而不是牛的性别。每个标志有一个取值,说明标志在逻辑上是一个谓词,它对集合中的元素具有排中律的性质,所以,每个元素都能有明确的取值。比如,学生的性别取值,正常情况不是男就是女。但是,如果我们善良作为一个特性标志,它的取值就并不那么简单。因为有些人是否善良不好判定。所以在表格语言和广义集合中,善良不适合(不满足)作为一个特性标志。但是,这并不妨碍它在日常语言中使用。正如张老师所说,标志值有能力描述各个个体之间的差异性。

表示词与标志取数值的单位有关。比如“身高,体重”这两个词,严格说是“身体高度”和“身体重量”,其中身体是学生的特性词,而高度与重量就是所谓的表示词了。
所以,一个完整的数据元所表达的是:学生性别,学生身体高度,学生身体重量。这是表格语言的一般形式。但是在表格中,可能写成四个字段:学生(姓名),性别,身高,体重。

学生这个对象是一个一个的,很好分辨出“个”来。我们是如何表达对象呢?最简单的方法是命名指称,就是给它编号。比如每个学生都有一个学号,唯一表达了一个学生。所以,对象的表达命名指称是一个常用的方法。姓名就是一个人的命名,也是指称一个学生的方法。指称表达的特点是直截了当,它没有描述什么,“点到为止”。

但是,也有许多不那么好分辨出“个”的对象。这时候我们如何来表达呢?或者说,这种情况我们如何来分辨出一个对象呢?

 

【作者: 表达的探究】【访问统计: 64】

评论人:yushan   2007-05-27 20:44:45   

“个”的分辨
“个”是一个什么词?它是一个单位?还是表示词?还是数量词?
每个自然数都是一个个的,所以数量就好象都已经隐含了“个”。
说个是个表示词,也很像。根据我们以往的建模型经验,最常见的表示词有:
比,量,大小,长度,高度,直径,半径,额,金额,指数,位置,距离,方位,斜角,深度,编号,线号,型号,编码,代码,宽度,厚度,深度,硬度等等。
比如:一个数据元为:企业管理费用,它取数值为:2。这个2表示的是比例还是绝对数量呢,这是首先应该区分的,所以仅有数量是不够的,比与量是两个重要的表示词。
你还可以说,可以从单位上区分。比是个系数,没有单位,而绝对数量应该有单位,比如企业管理费用的单位是万元。但是,桌子宽度与桌子长度,它们的单位都可以是米,但是如果加表示词,你还是无法确定一个数据元它的数量意义。从这个例子可见,表示词与单位非常接近,很相关,但是表示词并不是单位,它是两回事。

张老师倾向把“个”看成一个单位,而我倾向把“个”看成一个表示词。的确,它实在是太特殊的一个表示词,它描述了对象的离散状态,一个一个的样子。

张老师倾向把“个”与摩尔(克分子量?)联系起来作为单位来定义。我以为如果这样来定义个,“个”使用普遍性可能就会受到限制。从表格语言的普遍性来看,个是贯穿在表格使用中的,如果将它与摩尔联系起来好象有些勉强。
那么,“个”是以什么为分辨依据呢?我认为它是对象的分辨。具体对象没有问题,而抽象的对象如何分辨呢?比如一个抽象关系的“个”的定义是如何下呢?哲学家可能会说这是非常一个复杂的问题。幸好我们有计算机工程方面的经验,“个”定义不是别的,正是一个表格中的主键!如果这个主键是编号,它就是指称,如果它是一个组合键,它正是我们通过对其标志描述来得到对象的界定。它就是我们填写一条记录的依据。
关于主键的详细理论,可以看关系数据库的有关函数依赖理论,它正是关系数据库的理论基础。
以上是我不成熟的分析,还望各位高手指正赐教。