分类筛选
分类筛选:

关于分布式环境论文范文资料 与分布式环境中数据库模式设计实践有关论文参考文献

版权:原创标记原创 主题:分布式环境范文 科目:发表论文 2024-04-02

《分布式环境中数据库模式设计实践》:本论文为您写分布式环境毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

摘 要:近年来,数据规模呈爆炸式增长,使得传统集中式数据库难以满足业务需求.而分布式数据库可以将数据存储在多个节点上,具有更好的扩展性,从而可以支撑业务的不断增长.目前,许多企业已经开发出了成功的分布式数据库产品,例如Google Spanner、淘宝的OceanBase等.传统数据库模式设计中,三大范式(1NF、2NF和3NF)及其扩展范式能够减少数据冗余和更新异常,并保证数据的完整性.然而,在分布式架构下,严格遵循范式的模式设计可能带来查询效率较低等问题,而使用反范式模式设计方法通常可以有效提高查询效率.OceanBase是淘宝自主研发的分布式数据库,支持跨行跨表事务,并在OLTP中具有良好的性能,但是对于OLAP业务,其性能并不高.本文将以OceanBase为例,介绍如何利用反范式设计分布式数据库模式,以改善OLAP的查询性能,并通过在OceanBase上部署TPCH基准评测验证了反范式模式设计的有效性和高效性.

关键词:反范式;分布式数据库;OceanBase;TPCH

中图分类号:TP392文献标识码:ADOI:10.3969/j.issn.10005641.2014.05.026

收稿日期:201407

基金项目:国家973课题(2010CB731402)

第一作者:庞天泽,男,硕士生,研究方向为分布式数据库. Email:pangtz@ecnu.edu.com.

通信作者:宫学庆,男,教授,博士生导师,研究方向为数据库. Email: xqgong@sei.ecnu.edu.cn.

Implementation of database schema design in distributed environmentPANG Tianze,ZHANG Chendong,GAO Ming,GONG Xueqing

(Software Engineering Institute, East China Normal University, Shanghai200062, China)

Abstract:Recently, we he witnessed an exponential increase in the amount of data. It results in a problem that a centralized database is hard to scaleup to the massive business requirements. A distributed database (DDB) is an alternative that can be scalable to the large scale applications by distributing the data to multinode server. Now, many enterprises he succesully implemented some distributed databases, such as Google Spanner and TaoBao OceanBase. In the theory of the designation of traditional database, different normal forms reduce the operational exception and data redundancy, and also ensure the data integrity. However, a schema design strictly following the normal forms leads to an inefficiently distributed database system because of the large amount of distributed relational operations. Fortunately, denormalization can significantly improve the query efficiency by reducing the number of relations and the amount of the distributed relational operations. OceanBase, a distributed database, is implemented by TaoBao and has high performance for OLTP, rather than OLAP. In this paper, we introduce how to utilize denormalization to design the schema for OceanBase and to improve the performance of OLAP. Finally, we illustrate the efficiency and effectiveness of the denormalization design for OceanBase in the empirical study by using benchmark TPCH.

Key words:denormalization;distributed database;OceanBase;TPCH

第5期庞天泽,等:分布式环境中数据库模式设计实践华东师范大学学报(自然科学版)2014年0引言

数据库按照表结构来组织、存储和管理数据,被广泛应用于各行各业,以提供数据支撑[1].数据库模型主要分为网状模型、层次模型、关系模型和面向对象模型等[2].其中,关系模型使用二维表来描述数据间的关系,具有很好的数据独立性和简洁的数据组织结构.目前主流数据库管理系统均采用关系模型,如Oracle[3]、DB2[4]、MySql[5]等,这类传统的关系型数据库采用集中式的管理模式,即数据的存储和处理一般都集中于一个节点上.而数据库厂商则通过不断地提高节点的存储和处理能力,来应对业务和数据量的增长.但是,由于近几年互联网的快速发展,全球数据量正呈爆炸式增长,传统的集中式数据库难以承载海量数据的存储和访问.

分布式环境论文参考资料:

环境保护杂志

环境设计论文

环境污染论文

环境论文

环境工程论文

生态环境保护论文3000

结论:分布式环境中数据库模式设计实践为关于分布式环境方面的的相关大学硕士和相关本科毕业论文以及相关分布式环境论文开题报告范文和职称论文写作参考文献资料下载。

和你相关的