Code And Run

Blog of a running developer

Benvenuti nel mio blog o forse solo un training log, vedremo.

Trovare ed eliminare record (semi-)duplicati in SQL

Written by

Lo ammetto: non é certo la cosa più complicata del mondo eliminare le righe duplicate in un database; quando serve però non viene mai in mente un modo per farlo. Questo post lo categorizzo quindi come mio promemoria!

Perché (semi-)duplicati? Parto dall’esempio pratico: aggiungere una chiave ad una tabella già piena di dati. Ovviamente, per la legge di Murphy, i valori dei campi che dovrebbero diventare chiave non saranno mai tutti diversi. Voglio quindi eliminare dalla tabella i record con chiavi uguali, preservandone solo una copia per ognuno.

Poniamo che la nostra tabella di chiami table1 con campi field1,field2,field3 (la fantasia nel dare i nomi é il mio forte). Vogliamo far diventare field1 e field2 chiave primaria. Per eliminare i duplicati eseguiamo:

SELECT * FROM db.table1 as t2 WHERE (t2.field1,t2.field2,t2.field3) not in ( SELECT t1.field1,t1.field2, min(t1.field3) FROM db.table1 as t1 group by t1.field1,t1.field2)

Fatto! Come preannunciato niente di emozionante… 😉

Ovviamente la regola min(t1.field3) puo' essere cambiata a piacimento per conservare il record piu' conveniente ai fini dell’applicazione.

Programming

Alex

@alex@www.codeandrun.it

🏃🏻‍♂️ Marathoner | 💻 CTO @intre_scrumteam | 📱 tech addicted

680 posts

0 followers

Code And Run

Code And Run

Blog of a running developer

Trovare ed eliminare record (semi-)duplicati in SQL

My Profile

Your Profile

Comments

Leave a Reply Cancel reply

More posts

W11-12 – Maratona di Barcellona

W10 – Vento e stima del ritmo

W8-9 – Settimana di carico

W6/7 – Mezza Maratona di Barcellona