De nombreux Américains ont été choqués lorsque Donald Trump a été élu président. Les sondages
avait été clair et on ne s’attendait pas à ce que Trump gagne. Mais il l’a fait. Pourquoi? Parce que tout le monde ment. Pas toujours intentionnellement ou par malveillance, mais ils faire. Les formes traditionnelles de données, comme les enquêtes et les sondages, sont des proies faciles pour la désinformation.  Peut-être que certains partisans de Trump étaient gênés d’admettre leur préférence, ou peut-être de nombreux Américains libéraux qui avaient l’intention de voter pour Hillary Clinton a fini par ne pas se présenter le jour du scrutin. Ils se sont menti.
Les mégadonnées, en revanche, ne mentent pas. Dans cet instantané, comprenez la taille les données sont mieux utilisées, pourquoi elles peuvent être si puissantes et pourquoi nous en avons besoin.

La puissance des datas

Alors, pourquoi le Big Data est-il si puissant? Il offre de nouveaux types de données jamais utilisés auparavant.
Les sociologues et les spécialistes des données étaient auparavant contraints de s’appuyer sur des enquêtes et
questionnement simple afin de recueillir des informations, mais Internet a donné lieu à de nombreuses autres sources de données. Par exemple, au lieu de simplement demander à des concernant leurs préférences sexuelles, vous pouvez utiliser les données pornographiques recueillies à partir de d’innombrables sites Web afin de mieux comprendre la sexualité humaine.

Le Big Data fournit également des informations plus honnêtes. Les gens mentent pour protéger leur représentant
utations. Mais les gens ne mentent pas à Internet. Données recueillies à partir des résultats de recherche – que la recherche ait eu lieu sur Google ou sur PornHub – donne une précision frappante évaluer la façon dont les gens se sentent vraiment. En raison de la quantité considérable de données volumineuses disponibles, nous pouvons nous concentrer sur certaines parties de la population. Nous pouvons glaner des informations précises sur la base de spe-
paramètres spécifiques, tels que le lieu, le sexe, la race ou le sexe orientation. Rassemblement suffisamment de données provenant de sous-ensembles spécifiques de la population était bien plus difficile avant le big data était à portée de main.

Les mots et la data

Les mots que les gens utilisent ont toujours été un élément clé de la culture, mais avant à l’ère numérique, il était très difficile de transformer des mots en données. Maintenant que nous sommes en mesure de numériser du texte, une toute nouvelle opportunité de données est disponible. Pour comprendre à quel point c’est incroyable, considérez simplement le montant de texte dont nous disposons dans de nombreuses catégories différentes: journaux, scientifiques revues, livres et publications sur les réseaux sociaux, pour n’en nommer que quelques-uns. Et ce n’est même pas inclure les films, discours, conversations et chansons qui ont été trans-griffonné. Et maintenant, tous ces textes numériques peuvent être examinés pour des modèles spécifiques dans le un clin d’œil grâce à la technologie informatique. Vous n’avez pas besoin de lire une document pour savoir si l’auteur a utilisé un mot spécifique – vous pouvez recherche permanente.

Nous pouvons maintenant étudier et suivre des requêtes sans fin basées sur les données trouvées dans
mots. Les spécialistes des sciences sociales de Stanford et du Nord-Ouest se sont demandé comment ils pouvaient prédict si deux personnes sortaient à nouveau après leur premier rendez-vous. Ils ont décidé d’étudier modèles de conversation. Ils ont donc demandé à chaque personne d’apporter un magnétophone à leur date, et ces enregistrements ont été transcrits numériquement. Une fois ces conversations présentées sous forme de données textuelles, les scientifiques ont été capable de suivre l’utilisation de mots spécifiques et comment ceux-ci sont corrélés à une seconde Date. Par exemple, les femmes qui ont utilisé des termes non contraignants tels que «je suppose» et «En quelque sorte» lors de la première date étaient moins susceptibles de vouloir une deuxième date.

Les images et la data

Les auteurs d’un article académique intitulé «Measuring Economic Growth from Outer Space »a compris les avantages de l’utilisation de nouveaux types de données pour comprendre économie. Ces hommes ont remarqué que les pays en développement ne réussissaient souvent pas mesurer avec précision leur produit intérieur brut. Afin de résoudre ce problème, le thors a utilisé un nouveau type de données: les photographies. Ils ont émis l’hypothèse que le succès économique serait directement lié à beaucoup de lumière un pays utilisé la nuit. L’idée était que les pays plus pauvres être plus conservateurs dans leur utilisation de l’électricité. Les auteurs ont donc examiné le satellite
photographies prises par l’US Air Force.

Leur hypothèse s’est avérée vraie: les pays avec plus d’argent ont gardé leurs lumières la nuit. Par exemple, l’utilisation de la veilleuse en Indonésie a considérablement diminué pendant crise financière en 1998. Des photographies de nombreux autres pays ont suivi même modèle. Ceci n’est qu’un petit exemple de la façon dont les nouveaux types de données peuvent fournir immense valeur. Les data scientists n’ont pas besoin de se limiter aux anciennes méthodes comme les enquêtes quand il existe d’innombrables nouvelles façons de comprendre l’humanité.

SEO INSIDE est une agence de conseil SEO