Big Data

Published on May 2016 | Categories: Documents | Downloads: 12 | Comments: 0 | Views: 91
of 7
Download PDF   Embed   Report

Comments

Content


Big data
By Vangie Beal
Big data is a buzzword, or catch-phrase, used to describe a massive volume of both structured and unstructured data that is so large
that it's difficult to process using traditional database and software techniques. In most enterprise scenarios the data is too big or it
moves too fast or it exceeds current processing capacity. Big data has the potential to help companies improve operations and make
faster, more intelligent decisions.
Is Big Data a Volume or a Technology?While the term may seem to reference the volume of data, that isn't always the case. The term
big data, especially when used by vendors, may refer to the technology (which includes tools and processes) that an organization
requires to handle the large amounts of data and storage facilities. The term big data is believed to have originated with Web search
companies who needed to query very large distributed aggregations of loosely-structured data.
An Example of Big Data
An example of big data might be petabytes (1,024 terabytes) or exabytes (1,024 petabytes) of data consisting of billions to trillions of
records of millions of people—all from different sources (e.g. Web, sales, customer contact center, social media, mobile data and so
on). The data is typically loosely structured data that is often incomplete and inaccessible.
Big Data and Types of Business Datasets
When dealing with larger datasets, organizations face difficulties in being able to create, manipulate, and manage big data. Big data is
particularly a problem in business analytics because standard tools and procedures are not designed to search and analyze massive
datasets.
As research from Webopedia parent company QuinStreet demonstrates, big data initiatives are poised for explosive growth. QuinStreet
surveyed 540 enterprise decision-makers involved in big data and found the datasets of interest to many businesses today include
traditional structured databases of inventories, orders, and customer information, as well as unstructured data from the Web, social
networking sites, and intelligent devices.
This data, when captured, formatted, manipulated, stored, and analyzed can help a company to gain useful insight to increase
revenues, get or retain customers, and improve operations. Big data may also be called enterprise big data.
Big data analytics
Big data analytics refers to the process of collecting, organizing and analyzing large sets of data ("big data") to discover patterns and
other useful information. Not only will big data analytics help you to understand the information contained within the data, but it will also
help identify the data that is most important to the business and future business decisions. Big data analysts basically want the
knowledge that comes from analyzing the data.
The Benefits of Big Data Analytics
Enterprises are increasingly looking to find actionable insights into their data. Many big data projects originate from the need to answer
specific business questions. With the right big data analytics platforms in place, an enterprise can boost sales, increase efficiency, and
improve operations, customer service and risk management.
Webopedia parent company, QuinStreet, surveyed 540 enterprise decision-makers involved in big data purchases to learn which
business areas companies plan to use Big Data analytics to improve operations. About half of all respondents said they were applying
big data analytics to improve customer retention, help with product development and gain a competitive advantage.

For most organizations, big data analysis is a challenge. Consider the sheer volume of data and the many different formats of the data
(both structured and unstructured data) collected across the entire organization and the many different ways different types of data can
be combined, contrasted and analyzed to find patterns and other useful information.
The first challenge is in breaking down data silos to access all data an organization stores in different places and often in different
systems. A second big data challenge is in creating platforms that can pull in unstructured data as easily as structured data. This
massive volume of data is typically so large that it's difficult to process using traditional database and software methods.
Big Data Requires High-Performance Analytics
To analyze such a large volume of data, big data analytics is typically performed using specialized software tools and applications for
predictive analytics, data mining, text mining, forecasting and data optimization. Collectively these processes are separate but highly
integrated functions of high-performance analytics. Using big data tools and software enables an organization to process extremely
large volumes of data that a business has collected to determine which data is relevant and can be analyzed to drive better business
decisions in the future.
Examples of How Big Data Analytics is Used Today
As technology to break down data silos and analyze data improves, business can be transformed in all sorts of ways. According to
Datamation, today's advances in analyzing Big Data allow researchers to decode human DNA in minutes, predict where terrorists plan
to attack, determine which gene is mostly likely to be responsible for certain diseases and, of course, which ads you are most likely to
respond to on Facebook. The business cases for leveraging Big Data are compelling. For instance, Netflix mined its subscriber data to
put the essential ingredients together for its recent hit House of Cards, and subscriber data also prompted the company to bring
Arrested Development back from the dead.
Another example comes from one of the biggest mobile carriers in the world. France's Orange launched its Data for Development
project by releasing subscriber data for customers in the Ivory Coast. The 2.5 billion records, which were made anonymous, included
details on calls and text messages exchanged between 5 million users. Researchers accessed the data and sent Orange proposals for
how the data could serve as the foundation for development projects to improve public health and safety. Proposed projects included
one that showed how to improve public safety by tracking cell phone data to map where people went after emergencies; another
showed how to use cellular data for disease containment.

The pace of data creation will surely increase, especially as machine-to-machine communications gets cheaper and more common.
Think about how much data all of those sensor networks, burglar alarms and vehicle telematics systems will create.
According to IBM, every single day we create 2.5 quintillion bytes of data. IBM argues that the exponential growth of data means that
90 percent of the data that exists in the world today has been created in the last two years. "This data comes from everywhere: sensors
used to gather climate information, posts to social media sites, digital pictures and videos, e-commerce transaction records, and cell
phone GPS coordinates, to name a few."
Of course, it's important to remember that in early human history, anything as ephemeral as a tweet just would not have been recorded,
so these comparisons can only be taken so far.
To put the data explosion in context, consider this. Every minute of every day we create
More than 204 million email messages
Over 2 million Google search queries
48 hours of new YouTube videos
684,000 bits of content shared on Facebook
More than 100,000 tweets
$272,000 spent on e-commerce
3,600 new photos shared on Instagram
Nearly 350 new WordPress blog posts







T R A D U C C I Ó N

Big Data
(Grandes datos)
Por Vangie Beal
Big data es una palabra de moda, o frase usada para describir un volumen masivo de datos tanto estructurados como no estructurados
que es tan grande que es difícil de procesar utilizando técnicas de bases de datos y de software tradicionales. En la mayoría de
escenarios empresariales los datos son demasiado grandes o se mueve demasiado rápido o se excede la capacidad de
procesamiento actual. Big Data (grandes datos) tiene el potencial de ayudar a las empresas a mejorar sus operaciones y a tomar
decisiones más rápidas e inteligentemente.
¿Big Data es un volumen o una tecnología? Mientras que el término puede parecer para hacer referencia al volumen de datos, que no
siempre es el caso. El término Big Data, especialmente cuando se utilizan los proveedores, pueden referirse a la tecnología (que
incluye herramientas y procesos) que una organización necesita para manejar las grandes cantidades de datos e instalaciones de
almacenamiento. Se cree que el Big Data término que se originó con las empresas de búsqueda Web que necesitaban consultar muy
grandes agregaciones distribuidas de datos estructurados débilmente-. Un ejemplo de Big Data.
Un ejemplo del Big Data podría ser petabytes (1024 terabytes) o hexabytes (1.024 petabytes) de datos que constan de miles de
millones a miles de millones de registros de millones de personas, todos de diferentes fuentes (por ejemplo, Web, de ventas, centros
de contacto de clientes, medios de comunicación social, datos móviles y así sucesivamente). Los datos son normalmente poco
estructurados de datos que a menudo es incompleta e inaccesible. Datos y tipos de conjuntos de datos de negocios, cuando se
ocupan grandes conjuntos de datos, las organizaciones se enfrentan a dificultades en la capacidad de crear, manipular y gestionar
grandes volúmenes de datos. Big Data es un problema particularmente en análisis de negocios porque las herramientas y
procedimientos estándar no están diseñados para buscar y analizar conjuntos de datos masivos. Como la investigación de la
compañía matriz Webopedia QuinStreet demuestra, iniciativas de grandes datos que están preparados para un crecimiento explosivo.
QuinStreet encuestó a 540 empresas que toman las decisiones involucradas en grandes volúmenes de datos y encontró a los
conjuntos de datos de interés para muchas empresas hoy en día incluyen las bases de datos tradicionales estructurados de
inventarios, pedidos y la información del cliente, así como datos no estructurados de la Web, los sitios de redes sociales y dispositivos
inteligentes.
Estos datos, cuando son capturados, formateados, manipulados, almacenados y analizados, pueden ayudar a una empresa para
obtener información útil para aumentar los ingresos, obtener o retener a los clientes, y mejorar las operaciones. Big Data también
puede ser llamado por la empresa de datos grandes. Análisis de datos grandes, analítica de Big Data, se refiere al proceso de
recolección, organización y análisis de grandes conjuntos de datos ("big data") para descubrir patrones y otra información útil. No sólo
habrá análisis de Big Data ayudará a entender la información contenida en los datos, sino que también ayudará a identificar los datos
que son más importantes para el negocio y las decisiones futuras del negocio. Los analistas de Big Data básicamente quieren que el
conocimiento que proviene de analizar los datos. Los beneficios del análisis de Big Data. Las empresas están cada vez más buscando
para encontrar información procesable en sus datos. Muchos proyectos de Big Data se originan en la necesidad de responder a las
preguntas específicas del negocio. Con las grandes plataformas de análisis de los datos correctos en el lugar, una empresa puede
impulsar las ventas, aumentar la eficiencia, mejorar las operaciones, servir al cliente y gestionar riesgos. Empresa matriz Webopedia,
QuinStreet, encuestó a 540 empresas que toman las decisiones que participan en las compras de Big Data, para saber qué áreas de
negocio de las empresas planean utilizar el análisis de Big Data para mejorar las operaciones. Aproximadamente la mitad de todos los
encuestados dijeron que estaban aplicando el análisis de Big Data para mejorar la retención de clientes, ayudar con el desarrollo de
productos y obtener una ventaja competitiva.
El primer desafío es romper los silos de datos para tener acceso a todos los datos de un depósito de las organizaciones en diferentes
lugares y, a menudo en diferentes sistemas. Un segundo desafío de Big Data es en la creación de plataformas que pueden tirar los
datos no estructurados con tanta facilidad como los datos estructurados. Este volumen masivo de datos suele ser tan grande que es
difícil de procesar utilizando los métodos de base de datos y de software tradicionales. El análisis de Big Data requiere de alto
rendimiento para analizar un gran volumen de datos como el análisis de Big Data que se realiza normalmente utilizando herramientas
de software y aplicaciones especializadas para el análisis predictivo, minería de datos, minería de texto, la predicción y la optimización
de datos. En conjunto, estos procesos son funciones separadas pero altamente integradas de análisis de alto rendimiento. El uso de
herramientas de Big Data y software permite a una organización para procesar extremadamente grandes volúmenes de datos que un
negocio ha recogido para determinar qué datos son relevantes y pueden ser analizados para tomar mejores decisiones de negocio en
el futuro. Ejemplos de cómo el análisis de Big Data se utiliza hoy.
Como la tecnología para romper los silos de datos y análisis de datos, el negocio puede transformarse en todo tipo de formas según
Datamation, los avances en el análisis de Big Data de hoy permiten a los investigadores descifrar el ADN humano en cuestión de
minutos, predicen que los terroristas planean atacar, determinan qué gen es sobre todo probable que sea responsable de ciertas
enfermedades y, por supuesto, los anuncios que tienen más probabilidades de responder en Facebook. Los casos de negocio para
aprovechar los Big Data son convincentes. Por ejemplo, Netflix extrae sus datos de suscriptor para poner los ingredientes esenciales
juntos con su reciente éxito Castillo de naipes, y los datos de abonado también impulsaron a la empresa a llevar Arrested Development
de entre los muertos. Otro ejemplo proviene de una de las mayores compañías de telefonía móvil en el mundo, Orange de Francia
puso en marcha su proyecto de datos para el Desarrollo para la liberación de los datos de abonado de los clientes en la Costa de
Marfil. Los 2,5 mil millones de registros, que se hicieron en el anonimato, incluidos detalles sobre las llamadas y mensajes de texto
intercambiados entre 5 millones de usuarios. Los investigadores pueden acceder a los datos y enviar propuestas a Orange de cómo
los datos pueden servir de base para los proyectos de desarrollo para mejorar la salud y la seguridad pública. Los proyectos
propuestos incluyen uno que mostraba la forma de mejorar la seguridad pública mediante el seguimiento de los datos del teléfono
celular para mapear donde la gente iba tras una emergencia; otra mostró cómo usar los datos celulares para la contención de la
enfermedad. El ritmo de creación de datos seguramente aumentará, sobre todo porque las comunicaciones de máquina a máquina se
volverán más baratas y más comunes. Piense en la cantidad de datos de todas esas redes de sensores, alarmas antirrobo y los
sistemas telemáticos vehículo creará
De a cuerdo con IBM, cada día creamos 2,5 trillones de bytes de datos. IBM sostiene que el crecimiento exponencial de los datos
significa que el 90 por ciento de los datos que existen en el mundo de hoy se ha creado en los últimos dos años. "Estos datos vienen
de todas partes: sensores utilizados para recopilar información sobre el clima, los mensajes a sitios de medios sociales, fotos digitales
y videos, registros de transacciones de comercio electrónico, y las coordenadas de GPS del teléfono celular, para nombrar algunos."
Por supuesto, es importante recordar que en la historia humana temprana, algo tan efímero como un Tweet, simplemente no habría
sido registrado, por lo que estas comparaciones sólo pueden ser tomadas hasta el momento. Para poner la explosión de datos en
contexto, considere esto. Cada minuto de cada día creamos más de 204 millones de mensajes de correo electrónico, más de 2
millones de consultas Google de búsqueda de 48 horas, los vídeos de YouTube 684.000 bits de contenido compartido en Facebook,
más de 100.000 tweets de $ 272.000 gastados en el comercio electrónico 3600 nuevas fotos compartidas en Instagram Casi 350
nuevas entradas del blog WordPress.






















Sponsor Documents

Or use your account on DocShare.tips

Hide

Forgot your password?

Or register your new account on DocShare.tips

Hide

Lost your password? Please enter your email address. You will receive a link to create a new password.

Back to log-in

Close