Presto JDBC 连接中文乱码问题
一开始以为是 jdbc 的连接上没有设置 charset encoding,但是模仿的 MySQL 的语法配置上去之后,又报错说没有这个配置项 一顿折腾,各种 string getBytes 转码,还是不行,偶然间发现同样的程序,在 Windows 上跑出来的中文不是乱码的,于是灵光一现,在 Linux 在配置了一个 export LC_ALL=zh_CN.UTF-8 就可以了
View ArticleCentOS 离线安装 docker
参考 https://blog.csdn.net/u0123738… 下载了这些安装包 lxc-libs-1.0.11-1.el6.x86_64.rpm lua-alt-getopt-0.7.0-1.el6.noarch.rpm lua-filesystem-1.4.2-1.el6.x86_64.rpm lxc-1.0.11-1.el6.x86_64.rpm...
View Articlepostgresql 迁移数据到 MySQL
最近在搞 tidb,想找个方法往 MySQL 协议中快速写入数据,在 postgresql 下有 copy,找了下,MySQL 下也有 load data,其本质也是一个 insert,看到这里 https://blog.csdn.net/seven_33… 有一个思路是不走落地文件,挖坑待填 =========== 2019-9-4 回来填坑了,具体的方法如下 public static...
View ArticleTiDB 测试报告
# 1. 背景与目标 单机 tpg 在存储和 SQL 性能上有 scale-up 上限,TiDB 作为分布式 NewSQL 的一个实现,在线性扩展,容灾等方面有架构上的优势,本次测试主要研究 TiDB 是否能满足目前运营数据服务场景下的功能和性能需求。 # 2. TiDB 系统架构 参考 https://pingcap.com/docs-cn/v3… # 3. 部署方式 4 台 TS80A...
View Article再谈 SQL 引擎
之前整理过一次,几个 hadoop 生态下 SQL 引擎的区别, https://zrj.me/archives/1868 当时稍微有点局限,都是讨论的 hadoop 生态下的,(其实那个帖子里也有不少是非 hadoop 生态的了),最新又在看这块的东西,涉及一些新的 SQL 引擎,再整理一下 主要会看以下这么几个: TiDB CockRoachDB ClickHouse Kudu + Impala...
View ArticleTortoiseGit 配置
TortoiseGit 在 git pull 的时候报错,disconnected, no supported authentication methods available, server sent public key git.exe pull --progress -v --no-rebase "origin" fatal: Could not read from remote...
View Articlegit lfs 报错
git clone 一个仓库的时候报错 Use `git lfs logs last` to view the log. error: external filter 'git-lfs filter-process' failed fatal: 3rd/abseil/lib64_debug/libabsl_bad_any_cast_impl.a: smudge filter lfs failed...
View ArticleWindows 微信数据迁移
当某个分区的磁盘快满的时候,可能需要对 Windows 微信的数据迁移分区,但是,用微信自带的迁移工具,在聊天记录比较大的时候,(我的是 30G 左右),可能会导致卡死 解决的方法如下: 1. 关闭微信 2. 找到原有的聊天记录 WeChat Files 文件夹下自己的微信号对应的目录 3....
View Article面试题之子串匹配
又到了面试季,最近问了一个问题,好像不太好答,于是自己试试 leetcode 567 https://leetcode.com/problems/… package test20190925.test20190925; import java.util.Arrays; public class SubStringCheck { public static String...
View ArticleLLM 真的是人类之光
仅举几例 这个是 GPT 3.5 版本的 User 如果我要构建一个广告的 pctr 模型,我应该一步一步完成哪些工作? ChatGPT 构建广告的pCTR(点击率)模型是一个复杂的任务,需要以下步骤: 数据收集与清理: 收集包含广告相关信息的数据,并进行清理以处理缺失值、异常值等。 特征工程: 从原始数据中提取有用的特征,例如广告内容、投放位置、用户特征等。 数据切分:...
View Article