|
|
3.13, anonymous (??), 07:30, 06/08/2019 [^] [^^] [^^^] [ответить] [↓] [к модератору]
| +8 +/– |
Десятки гигабайт для СУБД -- это действительно не так много в наше время. В аналитические СУБД обычно загоняют много терабайт.
| |
|
4.17, лютый жабист__ (?), 08:56, 06/08/2019 [^] [^^] [^^^] [ответить] [↓] [к модератору]
| +1 +/– |
>В аналитические СУБД обычно загоняют много терабайт.
По ссылкам не ходил, но полагаю, что SQL там убогий и это поделие никак задачи Орацле подхватить не смогёт.
А десятки терабайт сейчас обычно грузят в хламоэластики от хламо-IOT или просто журналы. Васянская бигдата без обработки и агрегирования, ценность данных меньше, чем у коллекции порнухи... :)
| |
|
5.22, Аноним (22), 09:28, 06/08/2019 [^] [^^] [^^^] [ответить] [к модератору]
| +3 +/– |
бигдейта начинается тогда, когда вы не можете ни за какие деньги купить сервер, в память которого вместятся данные, которые надо держать там для обработки. Поэтому сравнивать spark - решение для кластера - с blazingsql - решением для отдельной машины - некорректно. Разумеется Hadoop-based решения будут медленнее. Зато они прожуют такой объём данных, на котором обычные базы поперхнутся.
| |
|
6.45, лютый жабист__ (?), 07:32, 08/08/2019 [^] [^^] [^^^] [ответить] [к модератору]
| +/– |
>бигдейта начинается тогда, когда вы не можете ни за какие деньги купить сервер, в память которого вместятся данные
В какую из памятей/памятёв? :) Спарк это больше про ОЗУ, Хадуп больше про сторадж.
Например одиночный сервер спланк с полкой на 100 терабайт это ещё не бигдата по меркам анонимусов опеннета? :)))
| |
|
|
|
5.21, Аноним (21), 09:28, 06/08/2019 [^] [^^] [^^^] [ответить] [к модератору]
| +/– |
Она, похоже, не питон. Про питон, судя по всему, автор новости от себя добавил. На питоне только какая-то демонстрашка выложена. Впрочем, будут ли байндинги под что-то полезное, ещё большой вопрос...
| |
|
|
5.24, Аноним (-), 09:44, 06/08/2019 [^] [^^] [^^^] [ответить] [к модератору]
| –1 +/– |
> на таких объёмах и своё можно запилить.
Чтобы что-то пилить, нужно, чтобы программисты толковые были. Откуда они у Сбера? Если только речь не про Ignite.
| |
5.25, Аноним (5), 10:06, 06/08/2019 [^] [^^] [^^^] [ответить] [к модератору]
| +4 +/– |
Это перепись админов локалхоста, что ли?
У гугла экзабайты, у сбера петабайты, десятки терабайт - даже у средне-мелких контор.
Размер БД менее 1 Тб сейчас - обычный hello word, не о чем говорить.
| |
|
|
3.38, ыы (?), 15:53, 06/08/2019 [^] [^^] [^^^] [ответить] [к модератору]
| +/– |
Речь идет не о БД как таковой, а о
"данных (десятки гигабайт), хранимых в табличных форматах (например, логи, статистика NetFlow и т.п.). "
Что сейчас с одной стороны- реально, а с другой- обычно в б_О_льших объемах и не существует.
Единичный лог на десяток гигов? Легко. Больше? Вы что ротацию логам не делаете вообще? Гнать вас в шею... Поэтому рассуждения про экзабайты баз данных (и про базы данных вообще) - они просто от невнимательного чтения и непонимания проблемы.
| |
|
4.40, пох. (?), 17:45, 06/08/2019 [^] [^^] [^^^] [ответить] [к модератору]
| +/– |
> "данных (десятки гигабайт), хранимых в табличных форматах (например, логи, статистика
> NetFlow и т.п.). "
хм, а зачем вы логи храните в "табличных форматах"?!
> Что сейчас с одной стороны- реально, а с другой- обычно в б_О_льших
> объемах и не существует.
Яровая и товарищмайор уже идут к вам! Несут расширятель хранимой емкости - очень почему-то похожий на бутылку, так что на всякий случай - запаситесь вазелином.
> Единичный лог на десяток гигов? Легко. Больше? Вы что ротацию логам не
> делаете вообще? Гнать вас в шею...
делают (более того, единичный лог на десяток гигов - это вот как раз "гнать в шею"), но от этого старые логи, внезапно, не перестают быть нужны.
И эффективный поиск по ним - тоже.
> Поэтому рассуждения про экзабайты баз данных (и про базы данных вообще) - они просто от
> невнимательного чтения и непонимания проблемы.
ну авторов никто за язык на тему сравнения со spark не тянул, он вообще-то совсем не для netflow.
| |
|
|
|
|
2.16, Аноним (16), 08:51, 06/08/2019 [^] [^^] [^^^] [ответить] [к модератору]
| –1 +/– |
>> Код написан на языке Python и открыт
> Какая красота, что это не правда. Что и подтверждается ссылкой https://github.com/rapidsai
Речь про BlazingSQL, а вы кидайте ссылку на Rapidsai. В новости следом расписано, что BlazingSQL лишь надстройка над RAPIDSai, который понятное дело не на Python.
| |
|
|
4.27, Аноним (16), 10:28, 06/08/2019 [^] [^^] [^^^] [ответить] [к модератору]
| +/– |
> https://github.com/BlazingDB - здесь написано, что они BlazingSQL. Тоже не питон
Там как раз везде написано, что Python. Первый же репозиторий "BlazingSQL is a lightweight, GPU accelerated, SQL engine built on RAPIDS. Python". Остальное левые надстройки или форки других проектов. С++ только для BlazingDB, а это совсем другой продукт.
Из Python они генерируют код для CUDA при помощи cuDF от RAPIDSai.
| |
|
5.29, Аноним (-), 10:52, 06/08/2019 [^] [^^] [^^^] [ответить] [к модератору]
| +/– |
> Из Python они генерируют код для CUDA при помощи cuDF от RAPIDSai.
Жуть какая.... Ретрограды и старпёры... В 21-м веке тащить питон в реальный проект.....
| |
|
|
|
|
|