Archivio per il mese di aprile 2006



Alla caccia delle immagini duplicate sul proprio HD

L’altro giorno mi sono deciso a iniziare un lavoro che avrei dovuto cominciare da mesi, ovvero andare a caccia di duplicati tra le circa 4500 immagini accumulate negli ultimi 2 anni e che occupavano sul mio hard-disk un totale di circa 3 GB tra foto, disegni e wallpapers (in vari formati, JPG PNG e GIF). Il problema di raccogliere wallpapers o scansioni di illustrazioni su internet è quello di ritrovarsi nel corso del tempo ad archiviare dei duplicati non ricordandosi di aver già scaricato le stesse immagini in passato. Posto che ovviamente non avevo minimamente intenzione di sfogliare una per una le immagini, sono andato alla ricerca di un software per automatizzare il più possibile questa attività e mi sono imbattuto in un programma shareware (licenza ottenibile su donazione libera) piuttosto interessante: PictureRelate. Questo programma consente di indicizzare una o più directory di immagini in vari formati, salvandone un indice con thumbnail e proprietà in un database su file tutto suo su cui poi potranno essere eseguiti ricerche e confronti molto rapidi (anche durante la fase di indicizzazione) e che potrà essere aggiornato in maniera differenziale con i successivi cambiamenti delle stesse directory. La funzionalità che mi interessava era appunto quella della ricerca di duplicati che… funziona spaventosamente bene. Identifica duplicati molto facilmente e permette di trovare immagini simili anche su formati, dimensioni e qualità differenti delle sorgenti in base a tolleranze e molti parametri impostabili a proprio piacimento al fine di ottenere una scrematura molto fine delle proprie ricerche. Una volta identificate e raggruppate le immagini simili o i duplicati si può poi decidere cosa fare delle singole immagini, anche cancellarle una per una sempre attraverso il programma. Ho risparmiato circa 350 MB eliminando i duplicati e di alcune immagini ho potuto tenere le versioni di migliore qualità verificandole attraverso l’interfaccia del programma che, tra l’altro, si e’ dimostrato estremamente stabile e molto veloce anche in fase di indicizzazione, eseguita per altro via rete, nonostante la mole di dati non indifferente. Sono disponibili maggiori dettagli e un pò di screenshot sul sito del programma.

Colonna sonora: “Diva” [BLOOD+ O.S.T. v1] – Mark Mancina

Google Maps sbarca in Europa

A quanto pare finalmente su Google Maps sono disponibili le mappe stradali europee dettagliate, penso proprio che passerò di conseguenza a GMaps per le mie “ricerche stradali”, anche se per ora la funzionalità di calcolo percorso non mi sembra ancora molto customizzabile sebbene comunque dia indicazioni corrette tutto il resto, navigazione delle mappe inclusa, è dannatamente comodo. Trovo la modalità ibrida (ovvero la possibilità di avere in overlay i tracciati e i nomi delle vie alle foto satellitari) veramente molto utile per avere dei riferimenti visivi, una cosa che prima facevo anche se solo quando realmente necessario con Google Earth, andandomi però a cercare le vie manualmente dopo aver identificato la zona in linea di massima con altri servizi di mappe stradali. Inutile dire che ho fatto qualche prova con casa mia e qualche altra località e non ha fallito un colpo, tuttavia la cosa decisamente notevole è quando ho inserito in “Cerca nella mappa” il nome dell’azienda per cui lavoro: non solo l’ha trovata e mi ha dato tutti i dettagli del caso ma andando a vedere sulla mappa la locazione in modalità satellite è impressionante notare come abbia sbagliato di soli 2 metri l’ingresso del cancello! Dai link presentati da google in seguito alla ricerca si può notare come googlebot abbia intelligentemente recuperato e interpretato i dati che sono presenti nel sito della società madre dalla relativa sezione in cui sono elencate tutte le aziende del gruppo. Veramente notevole, non c’è che dire.

Uptime ed eventuali

Mentre qui sta inziando a piovere e ancora non ho ben deciso come riempire il tempo di questa giornata di festa indubbiamente condizionata dalle avversità meteorologiche appena citate, ho notato una cosa che fino adesso è passata totalmente inosservata in azienda e riguarda il server web che ospita il relativo sito istituzionale più diverse altre amenità sparse:

[nontelodico@web2 nontelodico]$ uptime
10:21am up 377 days, 17:26, 1 user, load average: 0.00, 0.00, 0.00

Non riavviamo quella macchina da poco più di un anno! Nonostante segni un load average equivalente a un elettroencefalogramma piatto, non sono per niente mancati eventi in cui quella macchina per buone ore è stata piuttosto stressata e quindi tutto sommato lo considero un uptime di tutto rispetto. La seconda classificata sempre nell’ambito aziendale è all’interno della intranet e questa volta si tratta di un Windows 2000 Server:

Z:\>uptime
\\CLOROPHILLA has been up for: 169 day(s), 0 hour(s), 40 minute(s), 52 second(s)

Il nome può trarre in inganno dato che non è la macchina che ospita questo blog (ma ovviamente fui io a deciderne il nome :D ), comunque la cosa notevole è che in questo caso si tratta di un catorcio dal punto di vista HW (non pensate a un server, piuttosto a un minitower vecchio ormai di 6 anni) ma che per ora sta svolgendo ancora egregiamente il suo lavoro. Sorvegliata speciale con tanto di dita incrociate la volta che la spegneremo e riaccenderemo, con obbligatorio backup generale preventivo. Per quanto riguarda le altre macchine non ci sono dati rilevanti visto che sono state spente o riavviate in tempi recenti a causa di lavori nell’altra nostra server farm e nella sala server in azienda che le hanno interessate. Solo su un’altra macchina abbiamo qualche problema decisamente curioso che ogni tot siamo ci costringe a riavviarla per sentirci in pace con noi stessi, tra l’altro cercando su internet è risultato che non siamo nemmeno gli unici pertanto prossimamente ne parlerò.

Tag dei messaggi con Ultimate Tag Warrior

Approfittando di questo giorno di ferie a seguito di un weekend passato tra tranquillità e bel tempo, questa mattina ho ripreso un pò i test con il mio blog andando alla ricerca di un modo semplice ma allo stesso tempo efficace per “taggare” (perdonatemi il neologismo alquanto cacofonico) i post di questo blog. Dopo una decina di minuti di ricerca mi sono imbattuto in un plugin per WordPress chiamato Ultimate Tag Warrior che supporta addirittura più funzionalità di quanto cercassi:

  • interfaccia di amministrazione integrata nel pannello di amministrazione di WordPress che permette una buona configurabilità del plugin in question
  • sistema di suggerimento delle keyword tramite Tagyu o Yahoo in base ai contenuti del messaggio che si sta scrivendo. In realtà non è che funzioni un granchè bene il sistema soprattutto utilizzando Yahoo, però l’idea è buona e se migliorato può essere interessante
  • scorciatoie per l’aggiunta di tag già esistenti, per esempio tramite dropdown box, oppure rinomina di tag a livello globale
  • implementa un sistema per elencare i messaggi nel proprio blog non più solo con ricerca o con divisione per categoria ma anche in base ai relativi tag associati… e vale anche per il feed RSS
  • implementa anche un sistema per url-rewriting che va a completare il punto appena descritto
  • supporta la creazione automatica dei tag-link verso Technorati, Flickr, del.icio.us, Wikipedia, GadaBe e Zniff
  • permette di personalizzare la formattazione della lista dei tag associati ai messaggi con diverse combinazioni
  • supporta alcune feature interessanti come la possibilità di editare, rimuovere o aggiungere tag direttamente nella modalità di visualizzazione e attraverso l’utilizzo di AJAX, quindi senza refresh della pagina (ovviamente occorre essere loggati)

Installazione e configurazione sono due operazioni veramente semplici e veloci, in seguito l’usabilità è decisamente buona tanto che non ci è voluto molto a taggare buona parte dei precedenti messaggi di questo blog. Dando un’occhiata al codice sorgente di questo plugin forse non è proprio il massimo della vita e attualmente e il tutto non è facilmente estendibile (è abbastanza problematico aggiungere nuovi servizi senza mettere mano in diverse parti del codice, stessa cosa dicasi per le modalità di visualizzazione), comunque il suo sviluppo sembrerebbe piuttosto attivo quindi questo punto mi preoccupa relativamente per ora.

Il risultato? Guardate qui in basso:

Testando eAccelerator 0.9.5 beta2 con IIS6… whoops!

Nel mio articolo precedente ho introdotto eAccelerator come strumento per cercare di alleviare il carico dei propri server eliminando la fase di compilazione degli script PHP, riportando anche il risultato di qualche test rivelatosi piuttosto soddisfacente… tuttavia mancava ancora una cosa all’appello, ovvero un bel stress test per verificare la stabilità della soluzione. Detto fatto, peccato che il risultato sia riassumibile perfettamente con una onomatopea: kablam! (o boom! se preferite)

Leggi il resto di questo messaggio »