¿Por dónde empezar?
Existen múltiples fuentes de información. en este blog vamos a hablar siempre de fuentes de información en Internet. De esta forma no entraremos en distinguir que fuentes son mejores o peores si las online o las offline. Tampoco distinguiremos entre fuentes de información primaria o secundaria.
Así que lo mejor será empezar aclarando algunos términos.
¿Qué son fuentes de información online?
Lo cierto es que cualquier página web es una fuente de información online en potencia. Desde el mismo momento en que alguien publica algo en Internet se considera fuente de información.
No podemos distinguir entre blogs, redes sociales, prensa online o bases de datos. Todas ellas son sin excepción fuentes de información.
Está claro que este criterio eleva a categoría de fuente, a todo lo publicado, incluido los perfiles sociales y los comentarios realizados en cualquier red social.
Una fuente de información, sin embargo, debe tener características propias ofrecer contendidos de valor. Lo que verdaderamente convierte para nosotros, una página web, un diario o un perfil social, en una fuente de información es que lo se publique, sea de interés para nosotros.
En pocas palabras, una página web, es fuente de información para nosotros si sus contenidos son relevantes para nuestra actividad.Si lo piensas bien, no nos interesa todo lo que se publica, solo una parte ¿verdad? Pues ese es el criterio a la hora de seleccionar una página web, un perfil social o un blog como fuente de información en potencia.
¿Tipos de fuentes de información?
Bien, hemos hablado de características de las fuentes de información pero no hemos concretado ninguna. Una vez que consideramos una página web, un perfil social o un blog como relevante para nosotros, es importante tener en cuenta si esta fuente es una fuente abierta o una fuente cerrada.
Si estás pensando en montar un sistema de vigilancia en internet esta clasificación es de lo más importante.Fuentes de información abiertas: OSINT
En principio consideramos que una fuente de información es abierta si su acceso es público y no es necesario utilizar un usuario y contraseña. Menuda tontería ¿verdad?
Pues bien, esta tontería es de lo más importante cuando hablamos de automatizar los procesos de captura de información de una fuente. La necesidad de introducir un usuario y contraseña, supone casi siempre una barrera que solo se puede salvar, si estas autorizado a entrar y por su puesto realizando la consiguiente programación para acceder automáticamente.
Programaciones, generalmente de cierta complejidad, que por supuesto no están al alcance mas que de profesionales y que pueden suponer un autentico quebradero de cabeza.
Las fuentes de información abiertas suelen conocerse en el sector de la inteligencia competitiva como OSINT (Open Source intelligence)Fuentes de información cerradas:
Una fuente de información es cerrada cuando el contenido de la misma solo es accesible a través de un registro y autentificación previa del usuario.
Generalmente el contenido de estas fuentes de información, no está indexado por Google y se les considera por lo tanto parte del denominado Internet Invisible. Dentro de esta categoría podría estar todos los perfiles privados de Facebook por ejemplo.
Este tipo de fuentes son de gran utilidad, ya que constituyen autenticas bases de datos especializadas y en muchos casos requieren un pago a modo de suscripción anual o mensual. Es el caso de Scopus, IEEE, Axesor, D&B o la Webofscience. Otras por el contrario son gratuitas y se consideran autenticas minas de oro por la calidad de su información como espacenet.
Fuentes de información en Internet y Open data
Un aspecto poco conocido muy relacionado con las fuentes de información es el open data.
El open data o datos abiertos es una filosofía por la cual multitud de instituciones públicas y privadas están publicando en formatos (XML, CSV, ODS etc…) datos que estén libres de restricciones y de mecanismos de control.
Estos datos están centrados sobre todo en material no documental como información geográfica, geolocalizada, matemática, genómica, química, datos médicos, biodiversidad etc…que hasta hace poco han estado bajo el control de organizaciones.
Se busca con esto abrir las fuentes de información y los datos que contienen para el desarrollo de nuevas investigaciones, tesis y aplicaciones que permitan hacer grandes avances en la analítica y tratamiento de la información.
El open data, supone un antes y un después en la gestión de la información en la Red. No es ni bueno ni malo, pero abre un montón de posibilidades para las personas o empresas que sepan aprovecharlo.
Tratamiento de las fuentes: con RSS o sin RSS
Desde un punto de vista práctico también es interesante censar las fuentes entre aquellas que tienen canal RSS y aquellas que no.
¿Por qué es importante el canal RSS?
El RSS es un formato estándar de sindicación de contenidos. Lo que permite es suscribirse al canal de una fuente determinada y recibir los cambios en el contenido sobre una fuente que se acaba de actualizar.
La existencia de estos canales es especialmente relevante porque permiten a los usuarios recibir la información nueva publicada sin necesidad de visitar la página, blog o fuente de información pertinente. Además de esta cualidad tan útil, los canales RSS son perfectos por que permiten automatizar la captura de contenido, si son debidamente tratados.
De esta forma las fuentes de información que disponen de estos canales son más fáciles de tratar y de recuperar la información relevante.
¿Qué ocurre si no hay canal RSS?
En este caso la alternativa siempre pasa por intentar generar un canal RSS o bien programar la fuente para poder recuperar la información de manera automática.
Para aprender sobre estos aspectos, te invito a unirte a la comunidad y empezar hoy mismo tu propio proyecto de implantación de sistemas de información y automatización de fuentes.
Dentro de pocos años te darás cuenta de lo acertada que ha sido tu decisión de seguir mis pasos para implantar y desarrollar tu propio sistema de vigilancia e inteligencia competitiva, que te permita recuperar los datos e informaciones que necesitas.
No hay comentarios.:
Publicar un comentario