Archive for August, 2009
API Google Traductor
Por fin, Google lanza una API de traducción de idiomas, aunque en forma de AJAX
En diciembre nos preguntábamos si Google iba a lanzar alguna API para traducir palabras a diferentes idiomas, puesto que este servicio lo está ofreciendo dentro de varios de sus herramientas (traductor automático, ‘Google Talk‘). De esta manera, los desarrollaores de aplicaciones web podrían aprovechar la potencia de la tecnología de traducción de Google para mejorar la forma en la que muestran la información a los usuarios.
Ahora, se anuncia el denominado ‘Google AJAX Language API’, un conjunto de herramientas AJAX que permiten a los desarrolladores detectar y traducir textos en 13 idiomas (uno de ellos, el español). Tenéis la documentación en este enlace y un ejemplo que hemos creado en este otro enlace. Como podéis observar en el código fuente del HTML, la traducción se realiza a través del navegador web del usuario, con llamadas AJAX a los servidores de Google.
De esta manera, el desarrollador nunca podrá acceder a los servidores de Google, aunque seguro que con ingeniería inversa, y analizando el código de este JavaScript se pueden llegar a ellos. Nosotros en su día ya os mostramos en esta herramienta unas pistas para poder acceder a estos servidores.
Si simplemente quieres detectar el idioma de un texto (por ejemplo, para clasificar documentos que rastreas), puedes utilizar esta herramienta libre hecha con Perl (ver demo) que nos permite, desde nuestro propio servidor y sin acceder a servicios externos, detectar más de 60 idiomas de todo el mundo.
Googlebot
Googlebot es el robot que utiliza Google para ‘rastrear’ los sitios de Internet. No solamente indexa páginas web (HTML), sino que también extrae información de ficheros PDF, PS, XLS, DOC y algunos otros más.
La frecuencia con la que Googlebot accede a un sitio web depende del PageRank de éste. Contra mayor sea este valor, el robot accederá más asiduamente a sus páginas.
Por ejemplo, podemos comprobar que los sitios con PR10 (el valor más alto), como yahoo.com o usatoday.com, han sido ‘rastreados’ por Googlebot ayer o incluso o hoy mismo, mientras que otros han sido accedidos hace varias semanas. Esto se puede comprobar accediendo al ‘cache’ de esta página.
Para comprobar si Googlebot ha accedido a nuestro sitio web, deberemos echar un vistazo a los logs de nuestro servidor. En ellos, deberemos observar si hay registros de accesos en los que aparezca ‘googlebot’. Generalmente aparecerá el nombre del servidor, el cual podrá ser alguno de estos:
| SERVIDOR | DIRECCION IP |
| crawl1.googlebot.com | 216.239.46.20 |
| crawl2.googlebot.com | 216.239.46.39 |
| crawl3.googlebot.com | 216.239.46.61 |
| crawl4.googlebot.com | 216.239.46.82 |
| … | … |
| crawl9.googlebot.com | 216.239.46.234 |
| crawler1.googlebot.com | 64.68.86.9 |
| crawler2.googlebot.com | 64.68.86.55 |
| … | … |
| crawler14.googlebot.com | 64.68.82.138 |
Googlebot intentará acceder, como hacen la mayoría de los robots de los motores de búsqueda, al fichero ‘robots.txt’. En este archivo se deberán indicar las zonas de nuestro sitio web donde no queremos que entre ni Googlebot ni el resto de los buscadores. Para conocer más sobre ‘robots.txt’, existe un magnígico recurso: www.robotstxt.org.
Una vez que Googlebot haya ‘rastreado’ nuestra página, seguirá los enlaces que en ella encuentre (los HREF y los SRC).
Por lo tanto, si quieres que Googlebot indexe tu página web, solamente es necesario que algún otro sitio tenga un hiperenlace al tuyo. Si no es así, siempre puedes añadir directamente tu URL.
Además de este robot GoogleBot, existe otro, llamado FreshBot que ‘rastrea’ con mayor frecuencia los sitios webs con las noticias ‘más frescas’.
Equivalencias entre pt, px, em y porcentaje
Útil recurso para los que maquetamos en css, una tabla de equivalencias entre los diferentes tipos de medidas, ya que no siempre se usa la misma, dependiendo el tipo de diagramación que escojamos para el proyecto tendremos que usar unas u otras (o combinaciones entre varias). No todo se soluciona ya que los distintos navegadores las interpretan de formas diferentes pero puede ser una buena ayuda.
| Pts | Px | Em | Porcentaje |
| 6pt | 8px | 0.5em | 50% |
| 7pt | 9px | 0.55em | 55% |
| 7.5pt | 10px | 0.625em | 62.5% |
| 8pt | 11px | 0.7em | 70% |
| 9pt | 12px | 0.75em | 75% |
| 10pt | 13px | 0.8em | 80% |
| 10.5pt | 14px | 0.875em | 87.5% |
| 11pt | 15px | 0.95em | 95% |
| 12pt | 16px | 1em | 100% |
| 13pt | 17px | 1.05em | 105% |
| 13.5pt | 18px | 1.125em | 112.5% |
| 14pt | 19px | 1.2em | 120% |
| 14.5pt | 20px | 1.25em | 125% |
| 15pt | 21px | 1.3em | 130% |
| 16pt | 22px | 1.4em | 140% |
| 17pt | 23px | 1.45em | 145% |
| 18pt | 24px | 1.5em | 150% |
| 20pt | 26px | 1.6em | 160% |
| 22pt | 29px | 1.8em | 180% |
| 24pt | 32px | 2em | 200% |
| 26pt | 35px | 2.2em | 220% |
| 27pt | 36px | 2.25em | 225% |
| 28pt | 37px | 2.3em | 230% |
| 29pt | 38px | 2.35em | 235% |
| 30pt | 40px | 2.45em | 245% |
| 32pt | 42px | 2.55em | 255% |
| 34pt | 45px | 2.75em | 275% |
| 36pt | 48px | 3em | 300% |