And what do we do, then, with the data? Initiation to Big Data

Nobody can deny we swim in an information’s world, likewise it is true that most of us get overwhelmed about everything that exists “around”; but is is also true, on the one hand, the fact that so much noise is being generated, much invalid, untrue, uncertain information is being generated, and, on the other hand, the fact that we can not handle the good ones.
Alejandro Asúnsolo. @content_mk

 Fuente: rutgers.edu


Fuente: rutgers.edu

Yes, it is another usual concept in present posts, tweets and articles. And like every concept, almost every one of them, it is something that exists from long time ago, but something that is being formed and adapted to the new reality. The thing that confers Big Data that so-much special character in these times is that it is introduced like that thing we all understand to be necessary but that very few people know how and wht to do about. It is XXI century’s disease: you know you are doing it wrong but you keep on doing it because you can not stop to think about it too long.

What Big Data is?

So many things, but, to be understood, Big Data is when we go from the thought that our information can be hosted into a conventional data base to the thought that it is no longer enough, and, therefore, that we need resources, method, software, hardware and many other things so we can see the light among all the information we receive, notice, see and also disclaim about our environment.

Governments, scientific institutions and multiple players put big resources, from long time ago by now, into the right management of all the information they have. Obama himself did get a profit from it due to his reelection.

As for companies, Big Data appears when you actually go from considering a stocktaking or a reference of your items to pondering that the information you manage includes, besides, your CRM’s information, your logistic line, your interactions in Social Media, your Content Marketing campaigns, your loyalty club, the imputs of the coventional media…, and so on to something so big that becomes… Big.

Big Data exists, as we said before, from much more time ago than its own name does, but current technology makes a must from it inside big companies’ world, so much more inside those ones involved in ecommerce or presented as omnichannel companies. But it is not a company matter. Governments, scientific institutions and multiple players put big resources, from long time ago by now, into the right management of all the information they have. Obama himself did get a profit from it due to his reelection.

McKinsey said that a retail company could make their operational margins grow a 60% due to Big Data.

Therefore, Big Data is much more than software: it is planification, it is knowledge, it is hardware (beware of the hosting I will talk about later), it is specific resources and profiles, it is investigation and development, it is legal issues, it is time, time and time. And that is money, money and money. I will not discuss if it is investment or cost. If you consider the second one, then do not keep on reading.

You will have to decide which information you choose instead of another one, to make a priority among your necessities of information, to turn your quests into sequences due to the available resources.

There must be something when companies like Oracle, Microsoft, SAP, HP, Dell are investing hundreds of millions in resources and investigation of Big Dta, and there are already very many head hunters desperate for finding profiles in a level enough to approach to the responsability of managing the big data of a company.

Some more details:

  • It makes much more transparent, clear, the stored  information. It classifies, clarifies, administrates. It is, clearly, Ordena, clarifica, administra. It is, clearly, one of the most important values into current company.
  • It allows to enlarge the information’s circle of lifw with new variables we did not know before or we did not include before, it also manages the transactional elements.
  • Due to the stored and managed information we can take those business decisions much closer to customer’s reality.
  • Current digitalization strengthens the “just in time” of the information, and, therefore, of the companies’ reaction about what is happening.
  • It is and it will be an element which makes a difference versus the rivalry. The company to manage better the huge existing amount of information will be ahead the one that has stayed around the concept of Business Intelligence or the personalization of messages.
  • It is a window to the future, The complex and improved systems in variable measurement and behaviour studies are ingredients of a Big Data that will allow to overtake possible necessities into business issues, possible deviations about the estimation and, as I said before, to hit into decissionmaking.

What is “also” Big Data

But there are some basics we can not forget. It is clear the easy thing is to understand that a good management of the information is something useful, sure, but you must consider at least this elements:

  • Big data also is to host many interferences, many incomprehensible data, or, in the positive side, so many information that you will have to decide which one you prefer, the priority of your necessities about information, the sequences of your consultations to that information due to the available resources. I talked about planification before. That is.
  • It is a global environment, it is just not referred to the information of one of the elements you are about to consider. You have to consider every element of your data’s chain as a not independent part of the rest at all. An incidence captured in the chain supply has to fall on your call center information, a complaint in Facebook has to have a direct impact in your data base, or an improvement in the management procedures of the cash desks has to be seen and measured in your information system. And you can manage variables with different timing, different behaviour models. This is science, there is no doubt.

Current supply chain management must be concerned with multi-dimensional data that includes temporal and geospatial elements. Examples of temporal data are the acquisition of data from sources such as the Internet, speech and video data, real-time imaging from satellites, and ground-based sensors. Such inputs can be difficult to analyze because the different sources that comprise the data stream have different latencies. Moreover, the amount of temporal data is growing exponentially. Geospatial data, on the other hand, tracks location, whether that of a storm, a car, or a tornado that may render impassible to your trucks certain highways, thus demanding quick redirection to avoid time lost and equipment damage. For shippers, for example, both elements come into play: it is useful to know the location of ships, containers, and even packages in real time and/or two days prior in order to see if interim movement in is unusual and requires action. Coupled with temporal data, a logistics analyst can make informed decisions as events in his supply chain unfold.

Five Steps To Master Big Data and Predictive Analytics in 2014. Forbes.

  • Data are sensitive. Who is going to hace access, which data you are hosting, and where and which use you are going to give them. These are basics in any environment of more or less delicate information management, but if we talk about of Big Data you will have to propose that we talk as well about a Big sensitivity. You must ensure this issue well if you want in medium term to get over an audit that probably will give you many problems.
  • Knowledge takes place. And so much. One of the current problems is, clearly, that one that refers to data hosting. Wallmart handles 1.000.000 of transactions or every of their customers per hour, or Facebook, that has more than 50 billions of images. It is considered that companies duplicate their onformation in 1,2 years. And where do we put all this. There are so many solutions in the market place, pero they are expensive and they worth the cost, or are you going to be silly about the security copies?
  • It is not a place for rookies. Do not leave Big Data in unknown hands, just in the the most known hands. The required profiles have to be multidisciplinary, specialist, and they have to know so well the frameworks on your business’ model. There are necessities in the business and technical knowledges, you will need a very full team oriented to improve the hosting systems, processing, testing, depurating and development.
  • To have many data without  brains is the same than to not have data at all. Another big mistake is to enter the Big Data world and to have a lack in resources, time or even business sensitivity, and, to be well-used, you will have to go from Big Data to Smart Data, a not-so-easy issue if you can not do it.

As you can see, it is an issue you can not put aside, and you can not think it is simple, easy and answerable with a good software, as good as the company that tries to sell it to us can be.

¿Y qué hacemos, después, con los datos? Iniciación al Big Data

Que nadamos en un mundo de información nadie lo niega, que muchos de nosotros nos agobiamos por todo lo que “existe por ahí” es igualmente cierto; pero también lo es el que o se genera mucho ruido, mucha información inválida, incierta, dudosa, cuando menos, o el que no podemos manejar la que sí es buena.
Alejandro Asúnsolo. @content_mk

 Fuente: rutgers.edu


Fuente: rutgers.edu

Sí, es otro de esos conceptos habituales en los posts, tuits, y artículos de actualidad. Y como todos los conceptos, o casi, es algo que existe desde hace tiempo, pero que se va configurando y adaptando a la nueva realidad. Lo que confiere al Big Data ese carácter un tanto más especial en los tiempos que corren es que se presenta como eso que todos entendemos que es necesario pero que muy pocos saben cómo y qué hacer al respecto. Es el mal del siglo XXI: saber que lo estás haciendo mal pero seguir porque no puedes pararte a pensarlo demasiado.

¿Qué es el Big Data?

Muchas cosas, pero, para que nos entendamos, el Big Data es cuando pasamos de pensar que nuestra información se puede almacenar en una base de datos convencional a darnos cuenta de que ya no es suficiente y, por lo tanto, de que necesitamos recursos, metodología, software, hardware y unas cuantas cosas más para poder ver la luz entre toda la información que recibimos, percibimos, intuimos y aun desconocemos de nuestro entorno.

Gobiernos, instituciones científicas y múltiples jugadores hace tiempo que dedican grandes recursos al correcto manejo de toda su información. El mismo Obama se benefició de ello para su reelección.

En el caso de las empresas, el Big Data aparece cuando realmente pasas de considerar un inventario o referencial de tus productos a contemplar que la información que manejas incluye, además, la información de tu CRM, de tu línea de logística, de tus interacciones en el Social Media, de tus campañas de Marketing de Contenidos, de tu club de fidelización, de los imputs de los medios tradicionales…, y así hasta algo tan grande que se convierte en… big.

El Big Data existe, como decíamos, desde hace mucho más tiempo que su nombre, pero la tecnología actual hace que sea un must en el mundo de las grandes empresas, ni qué decir tienen las que se dedican al e-commerce o se presentan como compañías omnicanal. Pero no es una cuestión de empresas. Gobiernos, instituciones científicas y múltiples jugadores hace tiempo que dedican grandes recursos al correcto manejo de toda su información. El mismo Obama se benefició de ello para su reelección.

McKinsey hablaba de que una empresa de retail podría aumentar sus márgenes operacionales gracias al Big Data en un 60%.

Por tanto, el Big Data es mucho más que software: es planificación, es conocimiento, es hardware (ojo al almacenamiento del que hablaré más abajo), son recursos y perfiles dedicados, es investigación y desarrollo, es consideraciones jurídicas y legales, es tiempo, tiempo y tiempo. Y eso es dinero, dinero y dinero. No pienso caer en el absurdo de discutir si es inversión o gasto. Si consideras lo segundo, no sigas leyendo

Tendrás que decidir qué información quieres frente a otra, priorizar tus necesidades de información, secuenciar tus consultas a esa información en función de los recursos disponibles.

Algo ha de haber cuando empresas como Oracle, Microsoft, SAP, HP, Dell estén invirtiendo cientos de millones en recursos e investigación del Big Data, y muy valiosos y numerosos son ya los head hunters desesperados por encontrar perfiles que tengan un nivel suficiente para abordar la responsabilidad del manejo de los grandes datos de una compañía.

Algunos detalles más:

  • Hace mucho más transparente y clara la información que se almacena. Ordena, clarifica, administra. Es, sin duda, uno de los valores más importantes de la compañía del presente.
  • Permite ampliar el ciclo de vida de la información con nuevas variables antes no conocidas o incluidas, maneja los elementos transaccionales.
  • Gracias a la información que se almacena y que maneja permite tomar decisiones de negocio mucho más cercanas a la realidad de los clientes.
  • La digitalización actual fortalece el “just in time” de la información, y, por tanto, de la reacción de las empresas ante lo que está sucediendo.
  • Es y será un elemento diferenciador frente a la competencia. La empresa que sepa manejar correctamente la ingente cantidad de información que existe estará muy por delante de la que se ha quedado con el concepto de Bussiness Intelligence o con la personalización de los mensajes.
  • Es una ventana al futuro. Los complejos y mejorados sistemas de medición de variables y estudios de comportamiento son ingredientes de un Big Data que permitirá adelantar posibles necesidades de negocio, posibles desviaciones de lo estimado y, como decía antes, acertar en la toma de decisiones.

Qué es “también” el Big Data

Pero hay algunos básicos que no podemos olvidar. Está claro que lo fácil es entender que un buen manejo de la información es útil, claro, pero considera como mínimo los siguientes elementos:

  • El Big Data también es almacenar muchas interferencias, muchos datos incomprensibles, o puestos en positivo, tanta información que tendrás que decidir cuál quieres frente a otra, priorizar tus necesidades de información, secuenciar tus consultas a esa información en función de los recursos disponibles. Hablé antes de planificación. Pues eso.
  • Es un entorno global, no solo refiere a la información de uno de los elementos que vas a considerar. Has de considerar cada elemento de la cadena de tus datos como una pieza en absoluto independiente del resto. Una incidencia recogida en la cadena de suministro ha de incidir en tu información del call center, una queja en Facebook ha de tener un impacto directo en tu base de datos de clientes, o una mejora en los procesos de gestión de las cajas ha de verse reflejada y medida en tu sistema de información. Y puedes estar manejando variables que tienen cadencias distintas, modelos de comportamiento distinto. Es ciencia, no lo dudes.

Current supply chain management must be concerned with multi-dimensional data that includes temporal and geospatial elements. Examples of temporal data are the acquisition of data from sources such as the Internet, speech and video data, real-time imaging from satellites, and ground-based sensors. Such inputs can be difficult to analyze because the different sources that comprise the data stream have different latencies. Moreover, the amount of temporal data is growing exponentially. Geospatial data, on the other hand, tracks location, whether that of a storm, a car, or a tornado that may render impassible to your trucks certain highways, thus demanding quick redirection to avoid time lost and equipment damage. For shippers, for example, both elements come into play: it is useful to know the location of ships, containers, and even packages in real time and/or two days prior in order to see if interim movement in is unusual and requires action. Coupled with temporal data, a logistics analyst can make informed decisions as events in his supply chain unfold.

Five Steps To Master Big Data and Predictive Analytics in 2014. Forbes.

  • Los datos son sensibles. Quién va a tener acceso, qué datos estás almacenando y dónde, qué usos vas a dar. Son básicos de cualquier entorno de manejo de información más o menos delicada, pero si hablamos de un Big Data has de plantearte que hablamos igualmente de una big sensibilidad. Asegura bien este asunto si no quieres que a medio plazo tengas que superar una auditoría que probablemente te dará muchos problemas
  • El saber sí ocupa lugar. Y mucho. Uno de los problemas actuales es, sin duda, el que refiere al almacenamiento de los datos. Wallmart maneja 1.000.000 de transacciones de sus clientes cada hora, o Facebook, que tiene más de 50 billones (americanos) de imágenes. Se considera que las empresas duplican su información en 1,2 años. Y dónde metemos todo esto. Hay buenas soluciones en el mercado, pero cuestan y merece lo que cuestan, ¿o te vas a poner tonto con las copias de seguridad?
  • No es lugar para novatos. No dejes el Big data en manos de quien no sabe, y que sepa mucho. Los perfiles necesarios han de ser multidisciplinares, especialistas y deben conocer muy bien los entramados de tus modelos de negocio. Hay necesidades de conocimientos técnicos y de negocio, normalmente necesitarás un equipo bastante completo de personas que dediquen todo su tiempo a mejorar los sistemas de almacenamiento, procesamiento, análisis, depuración y desarrollo.
  • Tener muchos datos sin inteligencia es lo mismo que no tenerlos. Otro de los grandes errores es entrar en el mundo del Big Data para luego no tener recursos, tiempo o sencillamente sensibilidad empresarial como para no utilizarlos, y para utilizarlos bien, tendrás que pasar del Big Data al Smart Data, cosa nada fácil si no se sabe hacer.

Como verás, es un tema del que no se puede prescindir, pero del que tampoco se puede pensar que es sencillo, fácil y solucionable con un buen software, por muy buena que sea la empresa que nos lo quiera vender.