图数据库——初识

图:(对问题的抽象)

  • 节点(nodes)、顶点(vertices):对象或实体
  • 节点之间的联系:边(edges)、关系(relationships)
    节点和关系相互连接构成了一个图

图论:(对实际问题建模求解)

  • 用图来表征化对象及其间的关系
  • 在图上运用数学算法求解
  • 相关领域:
研究领域 简述
社会学 SocialNetwork 人与人间的相互作用,相互影响

可以用于更好地了解人口结构、特定群体对产品的商业价值...
生物学 帮助更精确地建模和分析
计算机科学 芯片设计、网络管理、推荐系统、UML建模、依赖分析...

案例:采用路径算法,可以分析系统设计中的变化对系统其他部分带来的影响
流量问题 电信网络、天然气网络、包裹递送网络...
路径问题 路径规划:可以用于物流领域等,最优化可用路线

Dijkstra算法、A*算法
网页搜索 PageRank

原有的搜索工具是在网页上进行关键词匹配,而google不仅关注关键词,而更是对不同网页间的超链接分析。他们假定网页比搜索结果更重要,因为他们更加丰富,有大量来自其他网页的输入连接,从而可以分析网页间的连接图。

数据库

  • 导航数据库

    问题:
    -- 导航数据库模型复杂性高
    -- 缺乏一个声明式的查询机制

  • 关系数据库

    问题:
    -- 关系数据库系统受规模影响严重。
    -- 关系数据库是“反关系”的,它比图数据库更缺乏关系。应用领域中采用关系模型建模会变得更加复杂、难以处理。
    -- 不够灵活

  • NoSQL

    a. 键值存储:键和值存储为无模式数据模型,可扩展性高(Amazon-Dynamo)
    b. 列式存储:包含一个大而稀疏的表结构,包括储存键的多个列(Google-BigTable)
    c. 文档存储:文档是一个半结构化的信息单元,可以是XML、JSON...储存和检索的方式都是无模式方式(MongoDB)
    d. 图数据库:提供一种用于管理结构复杂、网状分布的数据。(Neo4j)


NoSQL数据库本质上依据对关系的不同方法分类:

  • 聚合存储(键值存储、列式存储、文档存储)
    基于一个单一的、丰富的、紧耦合的数据结构,放松了事务性和一致性要求,以提高可扩展性,更关注规模。

  • 图数据库
    存储粒度更细,表现力更丰富,支持更复杂的查询,解决连接爆炸问题。
    什么时候用图数据库,什么时候不用?
    真实世界不同于关系型数据库背后的表模型,它是更丰富且充满关联的,有些部分是统一而有规则的,而其它部分确实特殊而不规则的。

  • 适用场合:
    -- 路经查询:查找不同数据元素之间是怎样相互关联的(不同节点之间查找路路径)。在图数据库中,这种查询更有优势是因为它不需要知道路径的结构而只是需要明确算法、起始节点、终止节点,系统就能自动完成查询。

    -- 实时数据的点击流查询

    -- 复杂查询:包含大量的复杂连接操作,这些连接操作将随着表的数量呈指数增长,即使是小数据集也可能构成一个无法解决的问题。而在图数据库中,不再存在连接操作,我们需要做的就是再图数据库中通过索引查找一个起始节点,然后就可以使用面索引临接特性,进行节点间的跳转(也可以看作是将关系显式存储了)。模式匹配查询就是一类典型代表:我们指定一个模式并且将模式锁定在几个起点上,图数据库就可以围绕锁定的节点快速确定是否有匹配的模式,不匹配的或者不与起始节点关联的都将被自动忽略——查询的性能与数据集大小无关,更多地依赖于结果集大小

  • 非适用场合:

    -- 大集合查询:如果只是需要获取大量的数据而不需要连接操作或是聚合运算,那么关系型数据库在性能上会更高,用图数据库的优势很小,甚至会是负面的影响。

    -- 简单聚合查询:简单查询中,读写聚合数据通常用图处理非常低效。

    -- 图的全局操作:例如查找一个图的中心、发现节点间未知的关系模式这些是从全局的角度研究一个图,通常需要另一类工具:图处理引擎、图计算引擎等等(OLTP-图数据库;OLAP-图计算引擎)

图数据库适合于复杂性的局部查询(随着数据集的不断增大,关系型数据库处理密集连接查询的性能会随之变差,但是图数据库却趋于保持不变,因为查询只与图的一部分相关),但是效率并没有关系型数据库高,所以随着复杂度的降低和问题的简单化,图数据库效率低的弱点将暴露。


图数据库管理系统(简称图数据库)

  • 特点一:底层存储
    --原生图存储:优化过的,专门为了存储和管理图设计
    --非原生图存储:将图数据序列化,保存到关系型数据库或是其他通用数据库

图结构意味着将顶点和边进行持久化的数据存储,它是以一种更自然的方式存储而不是对关系数据模型进行改造。遍历图的时候采用免索引邻接,无需再进行索引查找就可以找到相邻的节点。

  • 特点二:处理引擎
    --免索引邻接:关联节点在数据库中是物理意义上的指向彼此,适用于原生图处理。
    原生图存储的好处在于它是专门为性能和扩展性设计的,与之对应的非原生图存储好处在于他建立于一个非常成熟的非图后端,可能开发人员更加熟悉;原声图处理的好处在于遍历查询时性能优势大,但是劣势是对于未使用遍历的查询会比较困难,并且需要占用较大的内存

图计算引擎

图计算引擎技术主要应用于使用全局图算法的场景,需要扫描和批处理大规模的信息,它主要识别数据中的集群,通俗地讲,他在回答类似在一个社交网络中,平均每个人有多少联系

参考资料:
[1]《Neo4j 3.x入门经典·第二版》
[2] 书目源码:Learning-Neo4j-3x-Second-Edition
[3] 书目源码:图数据库
[4]《图数据库·第二版》
[5]《算法导论》
[6]《离散数学》

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 161,192评论 4 369
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,186评论 1 303
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 110,844评论 0 252
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,471评论 0 217
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,876评论 3 294
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,891评论 1 224
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,068评论 2 317
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,791评论 0 205
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,539评论 1 249
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,772评论 2 253
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,250评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,577评论 3 260
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,244评论 3 241
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,146评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,949评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,995评论 2 285
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,812评论 2 276

推荐阅读更多精彩内容