Bootstrap perfomance testing

assigned to @vs

Побенчмаркана версия 22.07.0

cluster size	iters/sec
1	3195
2	937
3	824
5	571
10	316
15	211
20	149
30	94
40	67
50	49
60	42
100	25

Код бенчмарка:

    luamod.set(
        "raft_propose_bench",
        tlua::function1(|secs: u64| -> Result<String, Error> {
            let start_at = Instant::now();
            let deadline = start_at + Duration::from_secs(secs);
            let node = traft::node::global()?;
            let mut counter = 0;
            loop {
                if Instant::now() > deadline {
                    break;
                }
                node.propose(traft::Op::Nop, Duration::from_secs(1))?;
                counter = counter + 1;
            }
            let stop_at = Instant::now();
            let elapsed = (stop_at - start_at).as_micros();
            Ok(format!("{:.0} iteration per sec", counter as f64 / elapsed as f64 * 1000000.0))
        }),
    );

Загрузка CPU соответствовала предполагаемой - лидер утилизировал одно ядро на 100% и очевидно становился узким местом. Фолловеры тоже использовали CPU. При тесте кластера из 2х пиров CPU как лидера так и фолловера было одинаковым - 90%.

Загрузка CPU соответствовала предполагаемой

Моим ожиданиям это не соответствует. Бенчмарк использует вызов node.propose, который блокирует текущий файбер пока запись не закоммитится. Для 1 инстанса это происходит почти мгновенно, но в остальных случаях требует собирать кворум и ходить по сети. Результаты 1 и 2 инстансов отличаются в 3 раза, это намекает что из кластера можно выжать больше, оптимизировав нагружалку. Для 1 инстанса, я думаю, результат тоже мог бы быть лучше чем 3000 rps.

    luamod.set(
        "box_replace_bench",
        tlua::function1(|secs: u64| -> Result<String, Error> {
            crate::tarantool::eval(
                r#"
                box.schema.space.create('bench', {
                    if_not_exists = true,
                    is_local = true,
                    format = {
                        {name = 'id', type = 'unsigned', is_nullable = false},
                        {name = 'value', type = 'string', is_nullable = false}
                    }
                })
                box.space.bench:create_index('pk', {
                    if_not_exists = true,
                    parts = {{'id'}}
                })
                "#
            );
            let start_at = Instant::now();
            let deadline = start_at + Duration::from_secs(secs);
            let mut counter = 0;
            let mut space = Space::find("bench").unwrap();
            loop {
                if Instant::now() > deadline {
                    break;
                }
                let row = (1, "hello");
                space.replace(&row).unwrap();
                counter = counter + 1;
            }
            let stop_at = Instant::now();
            let elapsed = (stop_at - start_at).as_micros();
            Ok(format!("{:.0} iteration per sec", counter as f64 / elapsed as f64 * 1000000.0))
        }),
    );

33034 iterations per sec

Луашный бенч

box.schema.space.create('bench', {
    if_not_exists = true,
    is_local = true,
    format = {
        {name = 'id', type = 'unsigned', is_nullable = false},
        {name = 'value', type = 'unsigned', is_nullable = false}
    }
})
box.space.bench:create_index('pk', {
    if_not_exists = true,
    parts = {{'id'}}
})
clock=require('clock')
fiber=require('fiber')
function f(n) for i=1, n do box.space.bench:replace({1, i}) end end
function bench_replace(n, c) do local fibers = {}; local t1 = clock.monotonic(); for i=1,c do fibers[i]=fiber.new(f, 1e5) end; for i=1,c do fibers[i]:set_joinable(true) end; for i=1,c do fibers[i]:join() end; local t2 = clock.monotonic(); return string.format("c=%s, n=%s, %.1f sec, %.0f rps", c, n*c, t2-t1, n*c/(t2-t1)) end end
bench_replace(1e5, 10)

Может быть выполнен на ванильном тарантуле, на picodata tarantool, на picodata run

Сейчас показывает на моём железе


vanilla tarantool 2.8	350k
vanilla tarantool 2.10	330k
picodata tarantool на master `cargo run -r -- tarantool`	145k
picodata на master `cargo run -r -- run`	142k

mentioned in merge request !264 (merged)

В мерж-реквесте !264 (merged) добавлены два бенчмарка

бенчмарк tarantool replace в секунду (pytest test/manual/test_benchmark.py -k replace)
бенчмарк picodata raft Nop в секунду (pytest test/manual/test_benchmark.py -k nop)

closed

mentioned in issue #980 (closed)

Bootstrap perfomance testing

Child items ...

Activity