Hur stor del av min tid som går åt att formatera om filer vill jag inte tänka på, kanske 30%? Alla program använder olika format, eller ännu värre: bara små skillnader. Som att saknade värden codas med "." i en fil men måste ändras till "0" i en annan. Kul.
Men idag sitter jag här med mina data som jag lyckades ladda ner igår. Illumina genotypningsdata i .idat format. Och jag hittar ingen dokumentation någonstans om hur jag kan använda detta format. Hur jag kan konvertera det till något annat. Vad som egentligen finns i dessa filer och hur. Inte ett enda blogginlägg, inte en enda fråga på något forum online.
Det är ju ännu roligare. Jag trodde att själva analysen skulle vara det svåraste i detta projekt. Pilutta mig.
Uppdatering: Och svaret är - Du behöver Genome Studios för att behandla idat filer. Ett program som bara kan installeras på PCs. I de två labb där jag är medlem finns sammanlagt en 30 personer, ingen av dessa har en PC. Så. Himla. Osmart.
Men killen på Keck kommer att kalla genotyperna åt oss så jag kommer att ha dem idag.
Inga kommentarer:
Skicka en kommentar