El filtrado de la informacion

Para realizar una lectura crítica es necesario contar con ciertos parámetros o criterios generales, que puedan ofrecer al lector un rápido y básico panorama, acerca del material que ha encontrado en la Red.



   Para ello debemos utilizar las herramientas y fuentes a nuestra disposición para valorar y seleccionar con criterio, y quedarnos solo con lo que de verdad estamos buscando o nos puede resultar de utilidad para nuestra consulta.

Existen distintos sistemas para el filtrado de información dependiendo de los intereses de los usuarios. Por un lado, tenemos de los filtros basados en el contenido mediante los cuales el sistema de forma automática trata de recomendar productos que el usuario ya había adquirido o consumido en el pasado comparándolo con su perfil. Mientras que el filtrado colaborativo mostraría al usuario productos que han gustado a usuarios con perfiles similares al suyo y le sugeriría productos que otros ya han adquirido. Finalmente, tendríamos sistemas de filtrado de la información social, que se basaría en la recomendación de informaciones y productos mediante las valoraciones voluntarias y colaborativa por parte de los usuarios que están dados de alta.

El filtrado basado en contenido

De una forma más concreta, dentro del filtrado basado en el contenido, cuando un usuario encuentra interesante un documento o un producto, el sistema puede facilitarle contenidos similares dependiendo de los pesos que se asignan a las palabras que mejor describen el contenido del texto o las características de un producto.

Las recomendaciones colaborativas

La propuesta de recomendaciones colaborativas es diferente a las recomendaciones por contenido ya que no se basan tan sólo en lo que un usuario haya podido opinar sobre ciertos contenidos ajustando su perfil a lo que haya indicado, sino que se trata de comparar perfiles de usuarios con gustos similares

Filtrado social de la información

Las anteriores aproximaciones respecto al filtrado de información han sido desarrolladas por tiendas en Internet cuyo objetivo era ofrecer a sus clientes productos relacionados a sus compras anteriores o a los ítems que habían consultado como, por ejemplo, Amazon o Netflix (Una tienda on-line muy popular en EE.UU. destinada al alquiler de DVDs); así como poner en contacto a clientes con gustos similares, además de otro tipo de interactuaciones entre ellos. Sin embargo, de la mano de la Web 2.0, nos llega otro tipo de sistemas de recomendación que se basan en las sugerencias que hace un usuario a sus amistades sobre productos o documentos que encuentra interesantes. Éste sería el caso de Menéame - Aunque el concepto original proviene de Estados Unidos con Digg o Reddit - donde los usuarios recomiendan las historias que consideran interesantes y éstas son valoradas por toda la comunidad promocionándola, situándola más arriba o más abajo en la portada o en las distintas secciones que tiene el sistema configuradas y comentándola según el caso.

¿Que es la curación de contenidos?
Juan Arellano publicó, hace unos años, un artículo denominado “Definiendo la curación de contenidos” en el que analizaba esta nueva disciplina y ofrecía la siguiente definición:

La curación de contenido se entiende como la capacidad por parte de un sistema o del ser humano de encontrar, organizar, filtrar y dotar de valor, relevancia, significatividad, en definitiva, de utilidad el contenido de un tema específico que procede de diversas fuentes (medios digitales, herramientas de comunicación, redes sociales…).

La curación filtra los contenidos y selecciona entre ellos los que son de utilidad.

Etapas de la curación de contenido:



     - Consultar
- Compartir
- Comentar
- Producir
- Curar.

Según estas indicaciones los usuarios pasamos a compartirlos para poder comentarlos con otros usuarios, después añadimos nuestros comentarios y finalmente producimos nuestros propios contenidos.

Existen 5 modelos de curación de contenidos:


El futuro de la Web Social se verá impulsado por estos curadores de contenido, content curators o “intermediarios críticos del conocimiento”, que se encargan de recoger y compartir los mejores contenidos en línea publicando compilaciones de gran valor creados por otras personas.



“¿Quién es un “curador de contenidos”? ¿Qué hace?

Según Dolors Reig quien lo define: como aquella persona que actúa como un Intermediario crítico del conocimiento. Alguien que busca, agrupa y comparte de forma contínua lo más relevante de cierta información; es decir de que se encarga de separar el grano (contenido de alto valor) de la paja (datos inconexos o irrelevantes) en su ámbito de especialización.

Actualmente el curador de contenidos se considera casi como una profesión  pero -a diferencia de otras profesiones (como por ejemplo la del creador de contenidos)- su objetivo fundamental es mantener la relevancia de la información que fluye libre o apoyada en herramientas concretas para la creación de entornos informacionales.

En un mundo cada vez más conectado y ubicuo (Web 3.0), las personas consumen todo tipo de información en cualquier momento y en cualquier lugar; además de compartirlo directamente en sus redes sociales, sin importarles demasiado si la información que retransmiten es original o ha sido “curada”.

Hay nuevas herramientas que surgen a través de la web 2.0.



Como la creación de diversas redes sociales, esenciales por otra parte para la curación de contenidos.

- Divulgación de lo que otros publican.
-Almacenamiento de publicaciones para su posterior revisión y análisis
-Estructuración de la información a través de diferentes grupos

Para nuestra actividad de curación de contenidos usaremos Scoop.it, un servicio que nos permite crear una página donde recopilar contenidos relacionados con un tema determinado. Estas páginas son denominadas topics (tópicos) y cada publicación contiene un enlace, un vídeo, una galería, denominado post.

Podemos crear tantos tópicos como queramos, añadiendo publicaciones que pueden contener enlaces, vídeos, galerías o simplemente texto y una imagen subida por nosotros desde nuestra computadora. Dependiendo de a donde dirija la URL que añadamos, el contenido se extraerá y aparecerá publicado directamente en nuestro tópico. Por ejemplo, si se trata de un post en un blog, se extraerá una imagen y el resumen (si es que lo tiene); si es un vídeo, se podrá reproducir directamente desde allí.

   En el documento que se adjunta, encontrarán un tutorial con los pasos necesarios para crear una cuenta en Scoop.it y convertirse en nuevos content curators.




Y como resultado de la actividad del módulo:


Enlaces de Interés:




EL ARTE DE PREGUNTAR





   De acuerdo a lo aprendido en el módulo 5 del MOOC  "Encontrando Tesoros en la Red", para encontrar la información en Internet, se requiere de la mayor precisión posible, para ello es importante formular la pregunta más adecuada, ordenar toda la información y los conocimientos previos que tenemos y los cuales deben estar en la respuesta.

   Después esta información debe estar traducida en forma que pueda ser interpretada por un buscador, denominada palabras clave o descriptores.

1.  Las palabras claves de campo temático: Son los nombres de las disciplinas y los términos imprescindibles que no pueden dejar de estar mencionadas en un documento que habla del tema de nuestra pregunta. 
2.     Las palabras claves de problema específico: Son frases breves que mencionan el asunto o su núcleo problemático más específico.  En realidad, no son palabras claves, sino frases específicas o expresiones claves, segmentos de texto insertos en un contexto que intentamos rescatar. Por eso es aconsejable incluir expresiones “en uso” que tengan que ver con el lenguaje que utilizamos habitualmente.
3.     Las palabras claves de referencias autorales: Son nombres de autores que se encuentran directamente relacionados con el problema, y que son considerados clásicos o referentes importantes en la materia. Sirven para identificar apellidos en listas bibliográficas que no siempre incluyen el nombre del autor, por lo tanto, es conveniente incluir sólo apellidos.

Tutorial para aprender a manejar el google académico.



Google Acádemico nos permite realizar búsquedas en un gran número de fuentes como:

Ø  Estudios revisados por especialistas
Ø  Tesis, libros, resúmenes y artículos de fuentes como editoriales académicas
Ø  Sociedades profesionales
Ø  Depósitos de impresiones preliminares
Ø  Universidades y otras organizaciones académicas.

Google Acádemico  ayuda a encontrar el material más relevante dentro del mundo de la investigación académica.


Ø  Buscar en diversas fuentes desde un solo sitio 
Ø  Encontrar documentos académicos, resúmenes y citas 
Ø  Localizar documentos académicos completos en la red 
Ø  Obtener información acerca de documentos académicos claves en un campo de investigación 

Ejercicio: El community manager en la actualidad


1.     Pregunta general:  El community manager en la actualidad
2.     Campo Temático: El community manager en la actualidad
3.     Problema especifico: "Community Manager" y "actualidad"


Continuando con el ejemplo

1.     La pregunta general en Google arrojó un total de 494.000 resultados.
2.     La pregunta usando palabras de Campo Temático en Google Académico arrojó un total de 5.760 resultados.

3.     La pregunta de palabras de Problema Especifico: arrojó un total de 1.380 resultados.

LA WEB SUPERFICIAL Y LA WEB PROFUNDA


Los motores de búsqueda tradicionales (Google, Yahoo, etc.) sólo ofrecen acceso a una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la web superficial o visible. Lo que resta, la Web profunda, es un amplísimo banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenido de sitios que demandan un login (aunque sea gratuito), entre otros tipos de contenido que no aparecen entre los resultados de una búsqueda convencional.


¿Cómo se diferencian?


Bueno, la Web visible comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta a sus formularios de búsqueda. Entre las características principales de estos sitios encontramos que su información no está contenida en bases de datos, son de libre acceso (no hay que registrarse para acceder), en general están formadas por páginas Web estáticas (páginas o archivos con una URL fija y accesibles desde otro enlace).

En contraste a la web visible, la Web invisible comprende toda la información disponible en Internet que no es recuperada interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos, que Si bien el 90% de estas bases de datos están públicamente disponibles en Internet, los robots de los buscadores solamente pueden indicar su página de entrada (homepage). La información almacenada es por consiguiente "invisible" a estos.

NOTA: Para poder acceder a la información disponible en las bases de datos hay que hacer consultas a través de páginas dinámicas (ASP, PHP...) es decir páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales) desapareciendo una vez cerrada la consulta.

DATO: Por cada millón de páginas visibles hay otros 500 o 550 millones ocultas, contiene alrededor de unos 100.000 sitios y el 90% suele ofertar su información pública y gratuitamente. La información pública y gratuita del Web invisible es actualmente de 400 a 550 veces mayor que el Web visible.

Para poder entender un poquito más la diferenciación entre la web superficial y la web profunda, citaremos una caracterización de la Web invisible o profunda de Sherman y Price (2001), en la cual identifican cuatro tipos de contenidos invisibles en la Web:


- la Web opaca
- la Web privada
- la Web propietaria
- la Web realmente invisible
La Web opaca: Se compone de archivos que no están incluidos en los motores de búsqueda por alguna de estas razones:

- Extensión de la indización
- Frecuencia de la indización
- Limitación del Número máximo de resultados visibles
- URL’s desconectadas

La Web privada: Se compone de archivos que no están incluidos en los motores de búsqueda por alguna de estas razones:

- Las páginas están protegidas por contraseñas (passwords)

- Contienen un archivo “robots.txt” para evitar ser indizadas.

- Contienen un campo “noindex” para evitar que el buscador indice la parte correspondiente al cuerpo de la página.


NOTA: Este segmento de la web no representa una gran pérdida en términos de valor de la información que contiene, ya que se trata, en general, de documentos excluidos deliberadamente por su falta de utilidad.

La Web propietaria: Incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o paga. Se dice que al menos 95% de la Web profunda contiene información de acceso público y gratuito.


La Web realmente invisible: Se compone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, como las siguientes:


- Páginas web que incluyen formatos como PDF, PostScript, Flash, Shockwave,
   programas ejecutables y archivos comprimidos.

- Páginas generadas dinámicamente, es decir, que se generan a partir de datos que
   introduce el usuario.

- Información almacenada en bases de datos relacionales.


Para tener en cuenta:



- Algunos buscadores recuperan archivos PDF y páginas con  imágenes, aunque de forma limitada;

- Es relativamente sencillo llegar hasta la “puerta” de las bases de datos con contenido importante;

- Existen ya motores avanzados capaces de realizar búsquedas directas simul- 

  táneas en varias bases de datos a la vez; y aunque la mayoría requieren  de

  pago, también ofrecen versiones gratuitas;

- El contenido que se genera en tiempo real pierde validez con mucha velocidad, salvo para análisis históricos; es relativamente sencillo llegar hasta la “puerta” de los servicios que ofrecen información en tiempo real;

- El contenido que se genera dinámicamente interesa únicamente a ciertos usuarios con características específicas;

- Es relativamente sencillo llegar hasta la “puerta” de los servicios que ofrecen contenido generado dinámicamente.


Recursos de búsqueda en la Web profunda por tipo de recurso:

Algunos recursos que hemos visto en el módulo 4 :



Buscadores


Metabuscadores


Directorios de buscadores

Alphasearch


Directorios


Directorios de bases de datos

WebData.com

Guías

AboutLibrarySpot