data warehouse Tajo Coreia para escorar as suas coisas na Cúpula Hadoop

Choi Hyun-sik, vice-presidente do projeto Apache Tajo e um engenheiro de pesquisa da grande infra-estrutura de dados start-up coreano, Grute r, disse ao site Korea: “o foco da minha apresentação será sobre a forma de avançar motor de processamento local de Tajo. ”

Empresa social; LinkedIn revela a sua nova plataforma de blogs; Big Data Analytics; não é a idade de grandes OLAP;? Big Data Analytics; DataRobot visa automatizar baixo pendurado fruto de ciência de dados; Big Data Analytics; fundador MapR John Schroeder desce, COO para substituir

“Motor Vectorized será discutida como uma solução. Como gargalos são formados, o que faz com performances a desacelerar, eo que fizemos para resolver esses usando o mecanismo “, disse ele.

Tajo é uma das muitas opções emergentes SQL-on-Hadoop destinados a analisar os dados armazenados no Hadoop Distributed File System (HDFS) e outras fontes de dados com baixa latência. Choi e sua equipe de desenvolvedores estão confiantes de seu motor é igual ou melhor do que concorrentes como o Hive e Cloudera Impala. Tajo fornece uma extração, transformação e carregamento (ETL) conjunto de recursos e um sistema de re-escrever consulta extensível.

desenvolvimento Tajo começou em 2010 e foi pego pela Apache Software Foundation em março do ano passado. Após um ano de “incubação” foi nomeado um projeto de nível superior Apache em abril, uma primeira vez para um projeto de análise coreano.

“Há mais contribuintes agora desde que foi nomeado como um projeto de nível superior Apache. Aquele que era muito ativo foi adicionado como um committer recentemente “, diz Choi. Ele diz que uma vez Tajo 0.8.0, lançado em maio, atinge a estabilidade e capacidade de uma base de dados comercializado eles vão lançar a versão 1.0.

maior telco da Coréia, SK Telecom, começou a usar Tajo para grandes análises de dados no ano passado. A empresa alega Tajo aumentou os tempos de processamento por um fator de 3,7 em comparação com Hive, enquanto a carga de trabalho diminuiu 70 por cento.

“Acho que a coisa mais importante em código aberto são as pessoas”, diz Choi. “As pessoas começam a ser atraídos para o código aberto [produtos] vendo como tecnologicamente legal eles estão em comunidades e conferências.” Ele está indo para Los Angeles depois de dar a saber tudo sobre Tajo em Big Data Acampamento 2014, começando 14 de Junho.

“Se alguém faz alguma coisa progressiva e voltada para o futuro em um projeto, você está atraído por ela”, diz Choi. “Espero mostrar durante a apresentação Summit Hadoop que” temos ido tão longe “, então se você quiser, você deve se juntar a nós. Eu adoraria ter grandes contribuintes juntasse ao nosso projecto. ”

LinkedIn revela a sua nova plataforma de blogs

É esta a idade de Big OLAP?

DataRobot visa automatizar fruto maduro da ciência de dados

fundador MapR John Schroeder desce, COO para substituir