关闭 x
IT技术网
    技 采 号
    ITJS.cn - 技术改变世界
    • 实用工具
    • 菜鸟教程
    IT采购网 中国存储网 科技号 CIO智库

    IT技术网

    IT采购网
    • 首页
    • 行业资讯
    • 系统运维
      • 操作系统
        • Windows
        • Linux
        • Mac OS
      • 数据库
        • MySQL
        • Oracle
        • SQL Server
      • 网站建设
    • 人工智能
    • 半导体芯片
    • 笔记本电脑
    • 智能手机
    • 智能汽车
    • 编程语言
    IT技术网 - ITJS.CN
    首页 » SQL语言 »数据挖掘逻辑体系结构的内容类型有哪些

    数据挖掘逻辑体系结构的内容类型有哪些

    2011-08-11 17:09:00 出处:ITJS
    分享

    在 Microsoft SQL Server Analysis Services 中,可以定义挖掘结构中各列的数据类型,以便影响创建挖掘模型时算法对这些列中数据的处理方式。不过,定义列数据类型只向算法提供有关列中数据的类型的信息,而不提供有关该数据的行为的信息。因此,Analysis Services 中的每个数据类型都支持一种或多种数据挖掘内容类型,可以使用这些内容类型来说明列包含的内容的行为。例如,假如列内容以特定的间隔(如一周中的某几天)重复,则可以将该列的内容类型指定为循环。

    有些算法要求提供特定的数据类型和内容类型才能正常工作。例如,Microsoft Naive Bayespdf 算法的输入不能为连续列,并且不能预测连续值。某些内容类型(如 Key Sequence)只能由特定算法使用。有关算法以及每种算法所支持的内容类型的列表,请参阅数据挖掘算法(Analysis Services – 数据挖掘)。

    下表介绍了数据挖掘中使用的内容类型,并标识了支持每种类型的数据类型。

    Discrete

    离散意味着列包含数值之间没有连续体的有限数量的数值。例如,性别列是一个典型的离散属性列,这是因为该数据表示特定数量的类别。

    离散属性列中的值不能意味着排序,即使这些值为数值也是如此。此外,即使用于离散列的值为数值,也无法计算小数值。电话区号即为数值离散数据的典型示例。

    所有数据挖掘数据类型均支持 Discrete 内容类型。

    Continuous

    此列包含的值表示某一允许中间值的范围中的数值数据。与表示有限、可数数据的离散列不同,连续列表示可缩放度量,且数据可能包含无限数目的小数值。温度列即为连续属性列的示例。

    以下数据类型支持 Continuous 内容类型:Date、Double 和 Long。

    Discretized

    该列包含表示组或存储桶的值,这些值属于从连续列派生的值。存储桶被视为有序的离散值。

    离散化是将一组连续数据的值放入存储桶的过程,以便得到有限数目的可能值。只能离散数值数据。

    您可以手动离散数据,以确保获取所需的存储桶,还可以使用 SQL Server Analysis Services 中提供的离散方法。某些算法自动执行离散。有关详细信息,请参阅如何更改挖掘模型中列的离散化。

    以下数据类型支持 Discretized 内容类型:Date、Double、Long 和 Text。

    Key

    该列唯一地标识一行。在事例表中,键列通常为数值或文本标识符。将内容类型设置为 key 可指示该列不应用于分析,而仅应用于跟踪记录。

    嵌套表也有键,但嵌套表键的用法稍有不同。假如某列是您需要分析的属性,则在嵌套表中将内容类型设置为 key。嵌套表键的值对于每个事例来说都必须唯一,但在整个事例集中可以重复。

    例如,假如分析的是客户购买的产品,则可以对于事例表中 CustomerID 列将内容类型设置为键,然后对于嵌套表中 PurchasedProducts 列再次将内容类型设置为键。

    注意:

    只有在使用已被定义为 Analysis Services 数据源视图的外部数据源中的数据时,嵌套表才可用。

    以下数据类型支持此内容类型:Date、Double、Long 和 Text。

    Key Sequence

    将内容类型设置为 key sequence 时,它指示列包含表示一个事件序列的值。这些值是有序值,但不必按等差排列。

    以下数据类型支持此内容类型:Double、Long、Text 和 Date。

    Key Time

    将内容类型设置为 key time 时,它指示两件事情:第一,值按顺序排列并表示时间刻度。第二,模型必须为时序模型或顺序分析和聚类分析模型。只有在这些模型中,您才可以将列指定为键时间。

    以下数据类型支持此内容类型:Double、Long 和 Date。

    Table

    嵌套表为列的一种特殊类型,它包含另外一个数据表,该数据表中有一列或多列和一行或多行。对于事例表中的任意特定行,此列可以包含多个值,所有的值均与父事例记录相关。例如,假如主事例表包含一个客户列表,则可能有多个包含嵌套表的列,例如,ProductsPurchased 列,嵌套表在该列中列出了此客户过去购买的产品,Hobbies 列出了该客户的兴趣。

    此列的数据类型始终为 Table。

    Cyclical pdf

    该列包含表示循环有序集的值。例如,一周内顺序编号的七天便是循环有序集,因为第一天紧跟第七天。

    循环列就内容类型而言既有序又离散。

    Analysis Services 中所有的数据挖掘数据类型都支持此内容类型。但是,大多数算法将循环值视为离散值,不会进行特殊处理。

    Orderedpdf

    Ordered 内容类型定义了序列或顺序;但是,用于排序的值并不表示该集中值之间的任何差或量级关系。例如,假如有序属性列包含按照等级顺序从一到五排列的有关技术等级的信息,则技术等级之间的差并不包含什么暗示信息;技术等级五不一定比技术等级一好五倍。

    有序属性列就内容类型而言是离散的。

    Analysis Services 中所有的数据挖掘数据类型都支持此内容类型。但是,大多数算法会将已排序值视为离散值,不会进行特殊处理。

    Classified

    除了前面列出的可通用于所有模型的内容类型以外,对于某些数据类型,还可以使用已分类列定义内容类型。

    原文链接:http://www.cnblogs.com/codeaspnet/archive/2011/07/22/2114400.html

    上一篇返回首页 下一篇

    声明: 此文观点不代表本站立场;转载务必保留本文链接;版权疑问请联系我们。

    别人在看

    正版 Windows 11产品密钥怎么查找/查看?

    还有3个月,微软将停止 Windows 10 的更新

    Windows 10 终止支持后,企业为何要立即升级?

    Windows 10 将于 2025年10 月终止技术支持,建议迁移到 Windows 11

    Windows 12 发布推迟,微软正全力筹备Windows 11 25H2更新

    Linux 退出 mail的命令是什么

    Linux 提醒 No space left on device,但我的空间看起来还有不少空余呢

    hiberfil.sys文件可以删除吗?了解该文件并手把手教你删除C盘的hiberfil.sys文件

    Window 10和 Windows 11哪个好?答案是:看你自己的需求

    盗版软件成公司里的“隐形炸弹”?老板们的“法务噩梦” 有救了!

    IT头条

    公安部:我国在售汽车搭载的“智驾”系统都不具备“自动驾驶”功能

    02:03

    液冷服务器概念股走强,博汇、润泽等液冷概念股票大涨

    01:17

    亚太地区的 AI 驱动型医疗保健:2025 年及以后的下一步是什么?

    16:30

    智能手机市场风云:iPhone领跑销量榜,华为缺席引争议

    15:43

    大数据算法和“老师傅”经验叠加 智慧化收储粮食尽显“科技范”

    15:17

    技术热点

    SQL汉字转换为拼音的函数

    windows 7系统无法运行Photoshop CS3的解决方法

    巧用MySQL加密函数对Web网站敏感数据进行保护

    MySQL基础知识简介

    Windows7和WinXP下如何实现不输密码自动登录系统的设置方法介绍

    windows 7系统ip地址冲突怎么办?windows 7系统IP地址冲突问题的

      友情链接:
    • IT采购网
    • 科技号
    • 中国存储网
    • 存储网
    • 半导体联盟
    • 医疗软件网
    • 软件中国
    • ITbrand
    • 采购中国
    • CIO智库
    • 考研题库
    • 法务网
    • AI工具网
    • 电子芯片网
    • 安全库
    • 隐私保护
    • 版权申明
    • 联系我们
    IT技术网 版权所有 © 2020-2025,京ICP备14047533号-20,Power by OK设计网

    在上方输入关键词后,回车键 开始搜索。Esc键 取消该搜索窗口。