跳到主要内容

Cassandra 安装与配置

介绍

Apache Cassandra 是一个高度可扩展的分布式 NoSQL 数据库,设计用于处理大量数据跨多个数据中心和云平台。它以其高可用性和无单点故障的特性而闻名。在本教程中,我们将逐步讲解如何在本地环境中安装和配置 Cassandra,并通过一个简单的实际案例来展示其基本用法。

安装 Cassandra

1. 下载 Cassandra

首先,访问 Apache Cassandra 官方网站 下载最新版本的 Cassandra。你可以选择下载二进制文件或源代码。

bash
wget https://downloads.apache.org/cassandra/4.0.0/apache-cassandra-4.0.0-bin.tar.gz

2. 解压文件

下载完成后,解压文件到你的工作目录。

bash
tar -xvzf apache-cassandra-4.0.0-bin.tar.gz

3. 配置环境变量

为了方便使用 Cassandra,你可以将其添加到系统的环境变量中。

bash
export CASSANDRA_HOME=/path/to/apache-cassandra-4.0.0
export PATH=$PATH:$CASSANDRA_HOME/bin

4. 启动 Cassandra

进入 Cassandra 的安装目录,并启动 Cassandra 服务。

bash
cd $CASSANDRA_HOME
bin/cassandra -f
备注

-f 参数表示在前台运行 Cassandra,这样你可以看到日志输出。如果你希望 Cassandra 在后台运行,可以省略 -f 参数。

配置 Cassandra

1. 配置文件

Cassandra 的主要配置文件位于 conf/cassandra.yaml。你可以通过编辑这个文件来配置 Cassandra 的各种参数。

yaml
cluster_name: 'MyCluster'
listen_address: 'localhost'
rpc_address: 'localhost'
seed_provider:
- class_name: org.apache.cassandra.locator.SimpleSeedProvider
parameters:
- seeds: "127.0.0.1"

2. 配置数据目录

默认情况下,Cassandra 将数据存储在 data 目录下。你可以通过修改 cassandra.yaml 文件中的 data_file_directories 来更改数据存储位置。

yaml
data_file_directories:
- /path/to/cassandra/data

3. 配置日志

Cassandra 的日志文件默认存储在 logs 目录下。你可以通过修改 logback.xml 文件来配置日志级别和输出格式。

xml
<logger name="com.datastax" level="INFO" />

实际案例

创建 Keyspace 和 Table

在 Cassandra 中,数据存储在 Keyspace 和 Table 中。以下是一个简单的例子,展示如何创建一个 Keyspace 和一个 Table。

sql
CREATE KEYSPACE mykeyspace WITH replication = {'class': 'SimpleStrategy', 'replication_factor': 1};

USE mykeyspace;

CREATE TABLE users (
user_id UUID PRIMARY KEY,
username TEXT,
email TEXT
);

插入和查询数据

接下来,我们可以插入一些数据并查询它。

sql
INSERT INTO users (user_id, username, email) VALUES (uuid(), 'alice', '[email protected]');
INSERT INTO users (user_id, username, email) VALUES (uuid(), 'bob', '[email protected]');

SELECT * FROM users;
提示

你可以使用 cqlsh 工具来执行这些 CQL 命令。cqlsh 是 Cassandra 自带的命令行工具,用于与 Cassandra 交互。

总结

通过本教程,你已经学会了如何在本地环境中安装和配置 Apache Cassandra,并创建了一个简单的 Keyspace 和 Table 来存储数据。Cassandra 是一个强大的分布式数据库,适用于需要高可用性和可扩展性的应用场景。

附加资源

练习

  1. 尝试在不同的机器上安装 Cassandra,并配置一个多节点的集群。
  2. 创建一个更复杂的数据模型,包含多个 Table 和索引。
  3. 使用 Cassandra 的 nodetool 工具监控集群状态。

希望这些内容能帮助你更好地理解和使用 Apache Cassandra。如果你有任何问题或需要进一步的帮助,请参考官方文档或社区资源。