{"id":231,"date":"2017-10-26T19:57:12","date_gmt":"2017-10-26T19:57:12","guid":{"rendered":"http:\/\/www.ibertech.org\/?p=231"},"modified":"2018-01-15T12:22:30","modified_gmt":"2018-01-15T12:22:30","slug":"big-data-y-analytics-el-tratamiento-del-dato","status":"publish","type":"post","link":"https:\/\/www.ibertech.org\/pt\/big-data-y-analytics-el-tratamiento-del-dato\/","title":{"rendered":"Big data &#038; Analytics"},"content":{"rendered":"<p><\/p>\n<h5>O tratamento dos dados<\/h5>\n<p>A era do Big data chegou. Falamos de uma realidade, n\u00e3o uma previs\u00e3o a curto e m\u00e9dio prazo. Na sociedade atual <strong>os dados \u00e9 a informa\u00e7\u00e3o<\/strong>. E sempre fomos ensinados que a <strong>informa\u00e7\u00e3o \u00e9 o poder.<\/strong> Uma das quest\u00f5es b\u00e1sicas \u00e9 a seguinte, como fa\u00e7o para gerenciar uma grande quantidade de dados gerados diariamente ? E o mais importante: Como estou seguro de que os dados que ser\u00e3o gerados do meu Big Data s\u00e3o 100 % confi\u00e1veis???<\/p>\n<p>Conv\u00e9n esclarecer que o n\u00edvel de especificidade e contextualiza\u00e7\u00e3o dos dados gera uma clara diferencia\u00e7\u00e3o em termos de sua  qualidade. Por exemplo, existem diferen\u00e7as significativas entre o registro  de visitas absolutas  em uma p\u00e1gina Web (dados brutos), e o registro de  visitas classificado em fun\u00e7\u00e3o do exato hor\u00e1rio da vista, a \u00e1rea geogr\u00e1fica do visitante, etc. ( Dados expl\u00edcitos) . A partir dessa premissa, o importante \u00e9 gerenciar essas informa\u00e7\u00f5es de uma forma otimizada  para garantir que temos uma base de dados de qualidade.<\/p>\n<p>A qualidade dos dados \u00e9 uma quest\u00e3o que tem cada vez mais sido valorizada nos departamentos de TI das empresas. E isso \u00e9 permitido atrav\u00e9s do desenvolvimento de uma pol\u00edtica de qualidade (Data Quality) estrita:<\/p>\n<ul>\n<li>Estr\u00e9gia funcional pr\u00e9via a coleta de informa\u00e7\u00f5es seja bem definida.<\/li>\n<li>Unifica\u00e7\u00e3o de crit\u00e9rios na coleta de dados.<\/li>\n<li>H\u00e1bitos de coleta de informa\u00e7\u00f5es rigorosos e met\u00f3dicos,  desenvolvidos com base no objetivo final da pesquisa.<\/li>\n<li>Feedbacks cont\u00ednuos posteriormente para a otimiza\u00e7\u00e3o de recursos em a\u00e7\u00f5es futuras.<\/li>\n<\/ul>\n<p>A ind\u00fastria de Data Quality est\u00e1 experimentando um crescimento exponencial em 2016, e a raz\u00e3o \u00e9 simples: a velocidade de gera\u00e7\u00e3o de dados hoje \u00e9 muito maior do que a capacidade dos seres humanos para acumular e clasificar de forma otimizada. Na verdade, de acordo com Martin Doyle, as seguintes estat\u00edsticas qualitativas de dados de Experian s\u00e3o um exemplo claro disso:<\/p>\n<ul>\n<li>63% das companhias n\u00e3o possuem uma estrat\u00e9gia claramente desenvolvida quanto ao <strong>Data Quality.<\/strong><\/li>\n<li>78% das empresas possuem numerosos <strong>problemas<\/strong> nos envios de<strong> e-mails.<\/strong><\/li>\n<li>81% das empresas <strong>n\u00e3o confiam 100%<\/strong> nos informes gerados a partir de <strong>suas bases de dados<\/strong> por n\u00e3o estar conformados com dados de qualidade.<\/li>\n<li>83% das empresas lutam contra <strong>banco de dados.<\/strong><\/li>\n<\/ul>\n<p>Quando a nossa estrat\u00e9gia de BI est\u00e1 bem planilficada, quando toda a equipe participante na coleta de dados \u00e9 e gera\u00e7\u00e3o de informes tenha como clara e objetivo final do trabalho e  por \u00faltimo mas n\u00e3o menos importante, quando temos um banco de dados de qualidade, com lotes de dados filtrados, limpo, em \u00faltima instancia  uma boa mat\u00e9ria-prima sobre a qual construir o nosso trabalho teremos estabelecido a cultura dos dados em nossa empresa, e n\u00f3s poderemos nos beneficiar de toda a informa\u00e7\u00e3o descritiva e preditiva que o Big data est\u00e1 contribuindo para os pioneiros no uso de BI.<\/p>\n<p>Eles j\u00e1 est\u00e3o \u00e0 frente , o que voc\u00ea  est\u00e1 esperando ?<\/p>\n<p><strong>Fonte:<\/strong><\/p>\n<ul>\n<li>Doyle,Martin. \u201cWill 2016 be the Year you Clean up your Dirty Data?. Datasciencecentral.com 12\/2015. 10 de Mayo de 2016. www.datasciencecentral.com\/profiles\/blogs\/will-2016-be-the-year-you-clean-up-your-dirty-data<\/li>\n<li>Guerrero, David, \u201cCalidad de datos: mucho m\u00e1s que una acci\u00f3n puntual\u201d blogs.deusto.es. 12\/2015. 10 de mayo de 2016. https:\/\/blogs.deusto.es\/bigdata\/calidad-de-datos-mucho-mas-que-una-accion-puntual\/<\/li>\n<\/ul>\n<p><\/p>","protected":false},"excerpt":{"rendered":"<p>Atualmente, a quantidade de dados gerados diariamente sofreu um aumento significativo de tal maneira que os bancos de dados&#8230;<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"wps_subtitle":"","acf":[],"_links":{"self":[{"href":"https:\/\/www.ibertech.org\/pt\/wp-json\/wp\/v2\/posts\/231"}],"collection":[{"href":"https:\/\/www.ibertech.org\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.ibertech.org\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.ibertech.org\/pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.ibertech.org\/pt\/wp-json\/wp\/v2\/comments?post=231"}],"version-history":[{"count":3,"href":"https:\/\/www.ibertech.org\/pt\/wp-json\/wp\/v2\/posts\/231\/revisions"}],"predecessor-version":[{"id":470,"href":"https:\/\/www.ibertech.org\/pt\/wp-json\/wp\/v2\/posts\/231\/revisions\/470"}],"wp:attachment":[{"href":"https:\/\/www.ibertech.org\/pt\/wp-json\/wp\/v2\/media?parent=231"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.ibertech.org\/pt\/wp-json\/wp\/v2\/categories?post=231"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.ibertech.org\/pt\/wp-json\/wp\/v2\/tags?post=231"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}