爱奔跑的程序猿

keep running, just do it!


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 阅读排行

  • 最新回复

  • 搜索

dolphinscheduler数据集成seatunnel使用

发表于 2024-08-21 | 分类于 dolphinscheduler | 评论: | 阅读次数:
AI摘要
GPT
本文介绍了DolphinScheduler、SeaTunnel的环境配置步骤,以及使用记录包括从FakeSource同步数据到PostgreSQL,Kafka2Kafka(Batch模式)和Kafka2PG(Stream模式)等场景的执行结果和问题记录。还包括自定义Transform以及多Source多Sink情况下的运行结果和缺陷。文章以文字和图片形式展示了配置步骤和问题解决过程。
阅读全文 »

dolphinscheduler数据集成datax使用

发表于 2024-08-15 | 分类于 dolphinscheduler | 评论: | 阅读次数:
AI摘要
GPT
本文介绍了在进行数据同步和转换时,对环境进行配置的步骤,并提供了示例。还介绍了在同步过程中进行字段映射和默认值填充的方法。此外,还介绍了如何使用TRANSFORMER实现数据定制化转换,并提供了几个常用的转换器示例。最后,介绍了如何使用UPSERT模式进行插入和更新,并示例了增量更新的方法。文章中还记录了两个常见的问题和解决方法。
阅读全文 »

BitSail使用

发表于 2024-08-14 | 评论: | 阅读次数:
AI摘要
GPT
这篇文章介绍了字节跳动开源的数据集成引擎 BitSail,基于分布式架构,支持多种数据源数据同步,包括批量、流式、增量等场景。用户可以通过配置文件来配置source端和sink端,实现数据处理流程,提供了丰富的基础功能,覆盖了各种同步场景。文章也指出目前官方文档中尚未提供关于数据转换的介绍。
阅读全文 »

文章AI摘要

发表于 2024-08-01 | 评论: | 阅读次数:
AI摘要
GPT
这篇文章介绍了如何使用MemFire创建一个基于AI的摘要功能。首先注册MemFire并创建应用和表,在后端主要使用云函数来判断是否有对应的摘要,没有则调用AI接口生成摘要。环境变量和前端代码都在Github上有具体的实现。文章还提供了一个博客链接作为参考,展示了如何给博客添加AI摘要功能。
阅读全文 »

flink性能优化记录

发表于 2024-06-21 | 分类于 flink | 评论: | 阅读次数:
AI摘要
GPT
这篇文章主要讨论了性能分析和优化方面的内容。首先介绍了通过火焰图、JVM工具(如jstack、jstat、jmap)等识别潜在瓶颈和内存问题,然后提出了算法优化、序列化优化、数据结构优化、内存优化、IO优化等具体优化方法。最后讨论了选择合适的GC算法、配置JVM参数、调整堆内存大小、监控和分析GC日志、避免FULL GC等策略,以优化Flink的性能。
阅读全文 »

raft选举

发表于 2022-05-29 | 分类于 数据库内核 , yugabyteDB , DocDB , 数据复制层 | 评论: | 阅读次数:
AI摘要
GPT

须知

服务器状态

一个 Raft 集群包含若干个服务器节点;5 个服务器节点是一个典型的例子,这允许整个系统容忍 2 个节点失效。在任何时刻,每一个服务器节点都处于这三个状态之一:领导人、跟随者或者候选人。在通常情况下,系统中只有一个领导人并且其他的节点全部都是跟随者。跟随者都是被动的:他们不会发送任何请求,只是简单的响应来自领导人或者候选人的请求。领导人处理所有的客户端请求(如果一个客户端和跟随者联系,那么跟随者会把请求重定向给领导人)。第三种状态,候选人,是用来在 5.2 节描述的选举新领导人时使用。图 4 展示了这些状态和他们之间的转换关系;这些转换关系会在接下来进行讨论。

阅读全文 »

raft启动

发表于 2022-05-23 | 分类于 数据库内核 , yugabyteDB , DocDB , 数据复制层 | 评论: | 阅读次数:
AI摘要
GPT

raft在tablet_peer初始化时被创建,伴随着tablet_peer的启动而启动。

tablet_peer

DocDB 中的数据复制是在 tablet 级别实现的,使用tablet-peers。每个表都被分片成一组tablets。

阅读全文 »

raft基本介绍

发表于 2022-05-18 | 分类于 数据库内核 , yugabyteDB , DocDB , 数据复制层 | 评论: | 阅读次数:
AI摘要
GPT

本文档介绍了与 YugaByte如何使用 Raft 处理日志复制和一致性的相关概念。

背景

DocDB 中的每个表都被分片成一组tablets。每个tablet由一组tablet-peers组成,每个tablet-peers都存储属于该tablet的数据的一个副本。tablet-peer 之间的数据复制使用raft协议,是高度一致的。

Raft基本知识

先来介绍一些Raft的基本知识。

阅读全文 »

部署ceph系统为k8s提供存储平台

发表于 2021-11-26 | 分类于 k8s | 评论: | 阅读次数:
AI摘要
GPT

背景

PersistentVolume(PV)是集群中已由管理员配置的一段网络存储。 集群中的资源就像一个节点是一个集群资源。 PV是诸如卷之类的卷插件,但是具有独立于使用PV的任何单个pod的生命周期。 该API对象包含存储的实现细节,即NFS,iSCSI或云提供商特定的存储系统。

PersistentVolumeClaim(PVC)是用户存储的请求。 它类似于pod。Pod消耗节点资源,PVC消耗存储资源。 pod可以请求特定级别的资源(CPU和内存)。 权限要求可以请求特定的大小和访问模式。

阅读全文 »

InnoDB全文索引简介

发表于 2021-11-05 | 分类于 数据库内核 , MySQL , 引擎差异 | 评论: | 阅读次数:
AI摘要
GPT

前言

从MySQL5.6版本开始支持InnoDB引擎的全文索引,语法层面上大多数兼容之前MyISAM的全文索引模式。所谓全文索引,是一种通过建立倒排索引,快速匹配文档的方式。MySQL支持三种模式的全文检索模式:

  1. 自然语言模式(IN NATURAL LANGUAGE MODE),即通过MATCH AGAINST 传递某个特定的字符串来进行检索。
  2. 布尔模式(IN BOOLEAN MODE),可以为检索的字符串增加操作符,例如“+”表示必须包含,“-”表示不包含,“*”表示通配符(这种情况, 即使传递的字符串较小或出现在停词中,也不会被过滤掉),其他还有很多特殊的布尔操作符,可以通过如下参数控制:

阅读全文 »
12…25
tianwei

tianwei

长路漫漫,上下求索

243 日志
57 分类
34 标签
GitHub E-Mail weibo
友情链接
  • 乘以零
  • 小逗嘛嘛
  • HY
  • 芷在安宁
  • kai
© 2024 tianwei 鄂ICP备2021009863号-1
由 Hexo 强力驱动 v3.8.0
|
主题 – NexT.Pisces v6.6.0
位访客 人阅读