Datos: quien te quiere te hará llorar

Son los verdaderos ganadores de esta carrera los que han aprendido tras el almacenamiento a realizar procesos de limpieza y curado de datos para luego proceder a la explotación (data science) y activación de estos para el conocimiento de sus negocios, clientes y convertir el dato en valor.

Es en el momento de utilizarlos para sacar este valor cuando han llegado nuevas discusiones más desde un punto de su uso final y donde la privacidad y la ética se han convertido en dos caballos de batalla. 

El tiempo de la pandemia ha traído momentos muy duros y que no se borrarán de nuestros recuerdos, pero como notable optimista que soy, quiero destacar lo mucho que ha ayudado en una digitalización de la sociedad, sus procesos y la manera de afrontar el futuro por las compañías en estos últimos años. 

Cierto es que se viene hablando de la importancia de los datos, de usarlos como la base de las decisiones en las compañías haciendo cada vez más que la subjetividad quede en el último cajón de la cómoda empresarial. Eso sí, la falta de criterio a la hora de saber qué es importante y qué no lo es ha hecho que en muchos de los casos se produzca un almacenamiento masivo de ellos y un nulo conocimiento de explotación, porque al igual que ocurre con infinidad de productos de gran consumo, sus materias primas no sirven de nada hasta ser transformados en productos de utilidad. 

Son los verdaderos ganadores de esta carrera los que han aprendido tras el almacenamiento a realizar procesos de limpieza y curado de datos para luego proceder a la explotación (data science) y activación de estos para el conocimiento de sus negocios, clientes y convertir el dato en valor.

Es en el momento de utilizarlos para sacar este valor cuando han llegado nuevas discusiones más desde un punto de su uso final y donde la privacidad y la ética se han convertido en dos caballos de batalla. 

La privacidad ha llenado portadas en los últimos meses y es que la tecnología siempre ha ido años por delante de su regulación. Hablamos de cambios que han venido afectando a diversos ámbitos e industrias y que por ejemplo, en el ecosistema publicitario, ha supuesto un giro en la relación de marca y consumidor así como un momento vital para la industria. Las marcas necesitan recopilar muchos datos de sus clientes para poder entender sus necesidades, evolución y poder garantizar su retención mediante experiencias personalizadas. El usuario por su lado, esta vez ya empoderado por la ley, exige la transparencia de lo recogido, saber para qué se va a usar y el control de impedirlo si llegara el momento. Relaciones de intercambio de valor con gran facilidad de generación de zonas grises. 

Y es en este punto en el que llega la ética: sin importar las muchas regulaciones que existen y las que puedan seguir llegando, la tecnología ha permitido llegar a límites insospechados de capacidad de aprendizaje y con ello de desarrollar metodologías predictivas en patrones de consumo o comportamiento. Ha llegado el momento en el que sentimos que nos conocen mejor de lo que nos conocemos nosotros mismos. Ese es el momento de parar y reflexionar, abrir un debate quizá más filosófico que tecnológico, pero en el que ambos perfiles se sienten y de definir de dónde están los límites y sus consecuencias. Esto será un debate incómodo que seguirá ocurriendo durante años, pero altamente necesario.  

En ese debate deberían también estar muy presentes y a evaluación, los distintos procesos de decisión basada en datos que se han ido desarrollando en sectores muy importantes para el ser humano. Corría ya el año 2016 cuando Cathy O’Neill explicaba en “Armas de destrucción matemática” entre muchos ejemplos, como algunos de los modelos matemáticos de los bancos ayudaban a incrementar la desigualdad en la sociedad al cerrar oportunidades de financiación a personas por provenir de códigos postales de baja poder adquisitivo, y de eso han pasado ya seis años. Este es un ejemplo muy claro de que la automatización de estos procesos debe estar bajo la atenta mirada experta humana para que no se comentan errores de una manera inconsciente. 

Al principio de todo esto me definí como alguien “notable optimista” y es así, porque creo en que la humanidad dirigirá sus esfuerzos apropiadamente, aunque no tengo el dataset que me lleva a esa conclusión. Me lo permito porque se está trabajando desde muchos puntos geográficos, corporativos y de vista por el bien de la sociedad en este aspecto. Ecosistemas como el anteriormente mencionado publicitario está trabajando conjuntamente con todos los big players del sector en el Privacy Sandbox, una iniciativa cuyo objetivo es el de mantener la privacidad del usuario ante todo y evolucionar con ella toda la manera de hacer las cosas en la publicidad. Otras instituciones como Research Data Alliance, CODATA, Open Fair, etc. trabajan velando por el uso ético de los datos, la explotación justa y controlada o factores de ciberseguridad. 

El uso de los datos es un bisturí que puede salvar o quitar una vida dependiendo de las manos en las que cae y es una responsabilidad de todos (gobiernos, compañías, asociaciones y de cada individuo) el de entender que un gran poder requiere una gran responsabilidad. 

No le quitemos la razón de ser a mi optimismo.

Artículo publicado en el medio El PeruanoThe pandemic period incited some particularly difficult moments that cannot be erased from our memories, but as a notable optimist, I would like to highlight how much it has helped in the digitalization of society, its processes and the way companies have faced the future in recent years. 

People have been talking about the importance of data, of using data as the basis for decision-making in companies, increasingly leaving subjectivity in the bottom drawer of the company cupboard. However, the lack of criteria when it comes to knowing what is important and what is not has meant that in many cases there is a massive stockpiling of them and no knowledge of exploitation, because as with many consumer products, their raw materials are useless until they are transformed into useful products. 

The real winners of this race have learned that beyond storage, they can cleanse and curate the data, and then proceed to their exploitation (data science) and activation to better the knowledge of their businesses and customers, thus converting data into value.

New discussions have arisen at the point of using them to extract this value, especially from an end-use point of view, and where privacy and ethics have become two workhorses. 

Privacy has been making headlines in recent months while technology has always been years ahead of regulations. We are talking about changes that have been affecting various fields and industries and that, for example, in the advertising ecosystem, have meant a change in the relationship between brand and consumer as well as a vital moment for the industry. Brands still need to collect a lot of data from their customers in order to understand their needs, trends and to be able to ensure their retention through personalized experiences. The user on the other hand, this time empowered by the law, demands transparency of what is collected, to know what it is going to be used for and the control to prevent it if the time comes. Value exchange relationships with great ease of generating gray zones. 

That is where ethics comes in: regardless of the many regulations that exist and those that may continue to come, technology has made it possible to reach unsuspected limits of learning capacity and thus to develop predictive methodologies in consumption or behavioral patterns. The time has come when we feel that they know us better than we know ourselves. This is the moment to stop and reflect, to open a debate, perhaps more philosophical than technological, but one in which both profiles feel and to define where the limits are and their consequences. This will be an uncomfortable debate that will be going on for years to come but highly necessary.  

In this debate, the various data-driven decision-making processes that have been developed in very important sectors for human beings should also be very much present and evaluated. It was already 2016 when Cathy O’Neill explained in «Weapons of Mathematical Destruction» among many examples, how some of the banks’ mathematical models helped to increase inequality in society by closing financing opportunities to people for coming from zip codes with low purchasing power, and six years have passed since then. This is a very clear example of the fact that the automation of these processes must be under the watchful eye of human experts so that no mistakes are made unconsciously. 

At the beginning of all this I defined myself as someone «remarkably optimistic» and that is so, because I believe that humanity will direct its efforts appropriately although I do not have the dataset that leads me to that conclusion. I indulge myself because work is being done from many geographical, corporate and viewpoints for the good of society in this regard. Ecosystems such as the aforementioned advertising one are working together with all the big players in the sector on the Privacy Sandbox, an initiative whose objective is to maintain user privacy first and foremost and evolve with it the whole way of doing things in advertising. Other institutions such as Research Data Alliance, CODATA, Open Fair, etc., work to ensure the ethical use of data, fair and controlled exploitation or cybersecurity factors. 

Using data is a scalpel that can save or take a life depending on the hands it falls into, and it is everyone’s responsibility (governments, companies, associations and individuals) to understand that great power requires great responsibility. 

Let’s not take away the raison d’être of my optimism. 

Article published in the media «El Peruano»Esta época da pandemia criou momentos muito difíceis que não se apagarão das nossas memórias, mas como um notável otimista, gostaria de salientar o quanto contribuiu para a digitalização da sociedade, os seus processos e a forma como as empresas enfrentaram o futuro nos últimos anos. 

É verdade que se tem falado da importância dos dados, de os utilizar nas empresas como base para a tomada de decisões, sendo a subjetividade cada vez menos relevante ao nível empresarial. No entanto, a falta de critérios na altura de determinar o que é ou não importante, fez com que em muitos casos existisse um armazenamento massivo de dados sem a obtenção de nenhum conhecimento da sua exploração, porque, tal como acontece com uma infinidade de produtos de grande consumo, as suas matérias-primas não servem de nada até serem transformadas em produtos úteis. 

Os verdadeiros vencedores desta corrida são os que, após o armazenamento, aprenderam a realizar processos de limpeza e de tratamento dos dados para posteriormente procederem à sua exploração (data science) e ativação para conhecerem o seu negócio, os seus clientes e transformarem os dados em valor. É na altura de os utilizar para obter este valor que surgiram novas discussões mais de um ponto de vista da sua utilização final e onde privacidade e a ética se tornaram em dois cavalos de batalha. 

A privacidade tem feito manchetes nos últimos meses uma vez que a tecnologia tem estado sempre anos à frente da sua regulamentação. Estamos a falar de alterações que têm afetado diversas áreas e setores e que, por exemplo, no ecossistema da publicidade, significaram uma mudança na relação entre as marcas e os consumidores, assim como um momento vital para o setor. As marcas têm de recolher muitos dados dos seus clientes para conseguirem compreender as suas necessidades, evolução e poderem garantir a sua retenção através de experiências personalizadas. Por outro lado, os utilizadores, agora capacitados pela lei, exigem transparência sobre o que é obtido, saber para que fim será utilizado e têm a capacidade de impedir a sua utilização caso o desejem. Relações de intercâmbio de valor com grande facilidade de geração de zonas cinzentas. 

E é neste ponto que entra a ética: Independentemente das muitas regulamentações existentes e futuras, a tecnologia tornou possível alcançar limites insuspeitos em termos de capacidade de aprendizagem e assim desenvolver metodologias preditivas de padrões de consumo ou de comportamento. Chegou o momento em que sentimos que nos conhecem melhor do que nos conhecemos a nós próprios. Este é o momento para parar e refletir, iniciar um debate talvez mais filosófico do que tecnológico, mas em que ambos os perfis estejam presentes, e para definir quais são os limites e as suas consequências. Este será um debate incómodo que continuará durante vários anos, mas que é extremamente necessário.  

Neste debate, os diferentes processos de tomada de decisão baseados em dados que foram desenvolvidos em setores muito importantes para os seres humanos também deverão estar muito presentes e ser avaliados. Em 2016, Cathy O’Neill explicou em «Armas de destruição matemática» entre muitos exemplos, como alguns dos modelos matemáticos dos bancos ajudaram a aumentar a desigualdade na sociedade, eliminando oportunidades de financiamento a pessoas com códigos postais de baixo rendimento, tendo já passado seis anos desde então. Este é um exemplo muito claro de que a automatização destes processos deverá estar sob o olhar atento dos especialistas humanos de modo a que não sejam cometidos erros de forma inconsciente. 

No início defini-me como um «notável otimista» e sou mesmo, porque acredito que a humanidade irá orientar os seus esforços de forma adequada, embora não tenha o dataset que me leva a essa conclusão. Permito-me sê-lo porque se está a trabalhar em muitos pontos geográficos, empresariais e de vista para o bem da sociedade a este respeito. Ecossistemas como o ecossistema publicitário acima mencionado estão a trabalhar em conjunto com todos os big players do setor na Privacy Sandbox, uma iniciativa cujo objetivo principal é manter a privacidade dos utilizadores e com esta fazer evoluir a forma de trabalhar em publicidade. Outras instituições tais como a Research Data Alliance, CODATA, Open Fair etc. ….. trabalham para garantir a utilização ética dos dados, na exploração justa e controlada ou em fatores de cibersegurança. 

A utilização dos dados é um bisturi que pode salvar ou tirar uma vida dependendo das mãos em que cai e é da responsabilidade de todos (governos, empresas, associações e de cada indivíduo) compreender que um grande poder implica uma grande responsabilidade. 

Não retiremos a razão de ser do meu otimismo.

Artigo publicado no jornal El Peruano

A época da pandemia trouxe momentos muito difíceis que ficarão nossas memórias, mas como um bom otimista que sou, quero destacar o quanto foi útil para a sociedade a digitalização, seus processos e a forma de encarar o futuro pelas empresas nos últimos anos. 

É verdade que se fala da importância dos dados, de usá-los como base para decisões nas empresas, deixando a subjetividade cada vez mais no fundo da gaveta empresarial. Porém, em muitos casos, a falta de critérios na hora de saber o que é importante e o que não é levou a um armazenamento massivo deles e nenhum conhecimento de como explorá-los, pois assim como acontece com muitos produtos de grande consumo, suas matérias-primas são inúteis até que sejam transformadas em produtos úteis. 

Os verdadeiros vencedores desta corrida são aqueles que aprenderam a processar a limpeza e a cura de dados ao armazená-los e depois passar para a exploração (ciência de dados) e ativação deles para o conhecimento de seus negócios, clientes e converter os dados em valor. Quando chega o momento de usá-los para extrair esse valor, surgem novas discussões sobre seu uso final, e é aí que a privacidade e a ética entram no debate. 

A privacidade dominou as manchetes nos últimos meses, e o fato é que a tecnologia sempre esteve anos à frente da regulamentação. Estamos falando de mudanças que afetam diversas áreas e indústrias e que no ecossistema publicitário, por exemplo, significaram uma mudança na relação entre marca e consumidor e um momento vital para a indústria. As marcas precisam coletar muitos dados dos clientes para entender suas necessidades, evolução e garantir sua lealdade por meio de experiências personalizadas. Por sua vez, o usuário, agora fortalecido pela lei, exige transparência dos dados coletado, quer saber para que serão usados e exige controle para excluí-los quando quiser. Essas são relações de troca fácil de valor que tem áreas bastante obscuras. 

E é aí que entra a ética: independentemente das inúmeras regulamentações existentes e de outras que ainda possam surgir, a tecnologia já permite atingir limites inéditos de capacidade de aprender e, consequentemente, desenvolver metodologias preditivas de padrões de consumo ou comportamento. Chegou o momento em que achamos que outros nos conhecem melhor do que nós mesmos. Esse é o momento de parar e refletir, de ter uma conversa talvez mais filosófica do que tecnológica, onde é importante definir sob essas duas perspectivas quais são os limites e suas consequências. Este será um debate desconfortável que continuará nos próximos anos, mas é super necessário.  

Nesse debate, também é preciso abordar e avaliar os diferentes processos de decisão com base em dados que estão sendo desenvolvidos em setores muito importantes para o ser humano. Em 2016, Cathy O’Neill explicou em «Armas de destruição matemática», entre muitos exemplos, como alguns dos modelos matemáticos dos bancos ajudaram a aumentar a desigualdade social ao fechar oportunidades de financiamento para pessoas que moravam em CEPs de baixo poder aquisitivo, e isso já faz seis anos. Esse é um exemplo bem claro de que a automação desses processos deve ser supervisionada por especialistas humanos para que erros não sejam cometidos inconscientemente. 

No início deste texto, eu me defini como um «bom otimista», porque acredito que a humanidade direcionará seus esforços da forma adequada, embora eu não tenha dados que me levem a essa conclusão. Eu me permito achar isso porque há trabalhos sendo feitos de muitos pontos de vista geográficos, corporativos e sociais nesse sentido. Alguns ecossistemas, como o de publicidade que eu mencionei, estão colaborando com todos os grandes atuantes do setor no Privacy Sandbox, uma iniciativa cujo objetivo é priorizar a privacidade do usuário e evoluir com ela todas as formas de publicidade. Outras instituições, como a Research Data Alliance, CODATA, Open Fair entre outras, estão trabalhando pelo uso ético dos dados, a exploração justa e controlada ou fatores de segurança cibernética. 

O uso dos dados é um bisturi que pode salvar ou tirar uma vida, dependendo das mãos que o manipulam, e todos são responsáveis (governos, empresas, associações e cada indivíduo) por entender que grande poder exige grande responsabilidade. 

Não tiremos a razão do meu otimismo.

Artigo publicado no jornal El Peruano

Autores

DAVID MARTÍN MUÑOZ