fredag 6 maj 2011

Hur djupt måste vi sekvensera?

Hur djupt måste ett prov sekvenseras för att producera tillförlitliga mätvärden på genuttrycksnivåer?

Vi vet att microarrays genererar variabla mätvärden. Ta ett prov och separera det i två innan hybridisering till arrayen och du får en avsevärd varians i genuttryck. Skrämmande, men sant.
Men hur är det med RNA seq?

Artikeln RNA-sequencing analysis on human B-cells kommer fram till att 500 miljoner reads behövs. Gulp. Pappret är väl värt att läsa, och det dom gör är att poola alla reads från 20 B-cells linjer (40 miljoner reads var -> 800 milj totalt) och sedan använda fraktioner av det och kolla på variansen jämfört med "det sanna värdet", dvs det som uppmättes med 800 miljoner reads. Först vid 500 miljoner reads kröp variansen i mätvärdena ner till 10%. Och detta var i ett enda stort poolat prov - alltså ingen intrainviduell variation över huvud taget! Stor gul OBS lapp till alla labb i världen, Tack.

Fejes diskuterar artikeln och får mig att inse vissa svagheter, men för mig kvarstår grundbudskapet - sekvensera mera!

(Fejes fick nys om artikeln genom twitter och fiamh, dvs min vän Oliver, som i sin tur fick tipset från mig. Liten värld!)

torsdag 5 maj 2011

printa poster

Efter att ha testat tre olika poster printers här i huset så har vi nu hittat en som fungerar. Vi är i det här fallet jag och Janice på IT support. Himla glad att hon hjälper till, själv hade jag gett upp vid det här laget. Men nu har vi en printer som funkar. Jag vet eftersom den i nuläget håller på att printa den största poster jag någonsin sett. Måste vara minst 2 meter bred. Det underliga i sammanhanget är att författarna inte verkar ha haft 2x1 meter saker att säga. Postern består nämligen av väldigt många underrubriker i väldigt stora färgade rutor, såhär:

(Tänk er denna så stor att när ni står vid ena änden ser ni knappt vad rubrikerna är på den andra sidan. Kanske 3x1 meter?!)

Det tycker jag är lite underligt.

Men nu kanske jag har spenderat tillräckligt med tid på att skapa den där bilder ovan så att min poster faktiskt printas numera. Håll tummarna!

Dear fellow nerds,

Det här är ju bara underbart - skapa en QR kod att sätta på din poster till nästa konferens!

Själv åker jag till Biology of Genomes nästa vecka, är riktigt peppad!

tisdag 3 maj 2011

Kroppens förfall

Såhär på äldre dar så utökar jag mina gällande allergener till att även inkludera pollen. Synd, för det finns ju så förbannat mkt pollen här. De symptom jag uppvisar vid allergi har även utökats och innefattar numera en huvudvärk lokaliserad till främre hjärnhalvan. Kul.

Men trots allt otroligt härligt att våren är här på riktigt.

tisdag 19 april 2011

Högtider och annat jag insett

Idag inleds Passover. Fick lov att googla, aldrig hört talas om högtiden innan. Men historien kan jag väldigt bra, har hört den hundratals gånger och hade antagligen serietidningar på ämnet som barn: Befrielsen av Israelerna från slaveri i Egypten. 10 plågor som drabbade Egyptierna, den sista och värsta dödandet av alla förstfödda barn (Moses som sattes i vassen ett sidospår). Hur Israelsena målade sina dörrar med blod från ett lamm för att Gud skulle passera (pass over) just deras hus på dödarstråket (därav lamm). Hur Israelerna skyndade sig att sticka och därmed inte ens hade tid att jäsa sitt bröd - därav osyrat/ojäst bröd.

Passover står i min kalender, men är inte en nationell helgdag. I själva verket finns ytterst få religiösa heldagar i detta land, juldagen är den enda vi har här i MA. Lite överraskande när jag flyttade hit och trodde att större delen av amerikanerna var konservativa bokstavstroende kristna. USA är så heterogent, flera religioner är väldigt stora, så vi firar istället de dom flesta amerikaner tycker är viktigt: Amerikanska saker. Patriots day, Colombus day, Veterans day, Martin Luther Kings day, Presidents day, etc etc. Gillar det! (med viss reservation)

lördag 16 april 2011

Analytiker

Finns något av en kulturkrock, ett missförstånd, eller om man är mer bitter - en oförmåga.

Jag arbetar i ett stort labb bestående av bänk-biologer. Deras arbete omfattar subpopulationer av immunologiska celler och cytokiner, deras verktyg är FACS, ELISA, qPCR, etc. Deras fokus effekten eller funktionen av en molekyl i en celltyp. Ibland flyttas fokus till dubbelpositiva celler - celler som producerar molekyler som innan setts som specifika för två speciella celltyper.

Jag är biolog, kan lite annat, men är biolog först och främst, kanske tom lite av en genetiker. Jag fascineras av biologiska system, som immunsystemet, hur det fungerar, hur det påverkas av olika saker och vad det leder till. Mitt fokus är data, vad det än må vara. GWAS, genexpression, proteinuttryck, TFBS, protein-protein interaktion. Mina verktyg är diverse program som antingen redan finns, eller som jag själv måste utveckla. Jag är ingen programmerare, ingen statistiker, men jag förstår nästan tillräckligt med statistik och jag kan använda programmering. Programmen jag skriver är inte viktiga - dom är antagligen oeffektiva, komplicerade och kräver säkert för mycket minne. Men dom gör det jag vill att dom ska göra, tar mig till nästa steg där jag igen utvärderar problemet och kommer fram till en lösning. Det kallas forskning, data-driven forskning.

Men börjar misstänka att jag anställdes som analytiker. Misstänka är ett svagt ord, det var precis så. Låt mig illustrera problematiken med ett citat från när vi planerade för ett nytt projekt, helt baserat på analytiska resultat:
" The analysts should write the method section for the statistics, we will write the science."
Vetenskapen var alltså begränsad till det immunologerna och klinikerna gjorde, medans analysen var det lilla steget som gjordes på slutet som inte alls hade med science att göra.

Det finns så många symptom på denna sjuka, denna inbillade värld där vi "analytiker" tar ett dataset och stoppar in det i ett lämpligt program som spottar ut resultat åt dom riktiga biologerna. Där designen av analysen, utvärderingen, utförandet och sammanställningen inte ses som vetenskap. Där det helt självklart är lika enkelt att ladda in ett microarray set och göra ett t-test, som att analysera RNA seq, GWAS och ChIP seq på ett integrerat och vettigt sätt. Där 3 microarrays av tre phenotyper på något sätt borde ge lika rika och intressanta resultat som 50 microarrays över en tidsserie. Där genom-vida data set är coola, men där enkla resultat som enbart framhäver en enda molekyl är det enda önskvärda. Där jag är en analytiker och underförstått inte förstår biologi eller immunologi, men där jag ändå ska utvärdera resultaten och förklara vad dom betyder för immunologerna. Tabellerna är ju alles för stora.

Jag är ingen analytiker. Jag är en biolog, en forskare. Verkligheten är inte endimensionell, eller ens 2D. Verkligheten är ett stort förbannat komplicerat nätverk av orsak och verkan på alla nivåer. För att göra detta ordentligt så måste vi göra det tillsammans. Det är inte ett problem att den/de data-centrerade biologen ska vara med på pappret, det är en självklarhet. Utan oss kan ni inte designa, utför, analysera eller utvärdera datat. Utan oss kommer ni fortsätta producera värdelösa dataset. Jag fattar inte hur det kan vara så svårt att inse. Jag kan väldigt enkelt se den motsvarande bilden från "vår" sida, som ju egentligen är lika illa. Att det är ju vi, data-biologerna, som gör allt som är forskning. Vi som designar, planerar, tar hand om datat, tolkar det. Det bänk-biologerna gör att ju bara praktiskt - sorterar celler, kör lite andra maskiner. Maskinister, tekniker möjligtvis. Men som sagt, jag är smartare än så.

torsdag 7 april 2011

Skriva

Det spelar egentligen ingen roll vad det handlar om, uppsatsen i 9:an eller en artikel på den här nivån, trenden är densamma. Jag börjar skriva, jag älskar att skriva, jag tycker oftast det blir rätt bra. Texten växer, dagen tar slut och jag är ganska nöjd.
Nästa dag. Här skiljer sig den 15åriga jag med den nuvarande. I nian tog jag upp mitt dokument (skrivhäfte?!) och tyckte allt var skit. Och började om från början. Nu för tiden får jag en kommentar av en medförfattare eller annan snäll själ, oftast väldigt bra kommentarer, om vad som saknas, är otydligt eller dylikt. Eller bara ser ngn av dessa svagheter själv. Försöker ändra den text som finns, flyttar om, formulerar om, lägger till... Och flödet är borta! Så jag raderar mer och mer och .. börjar om. Tycker att det blir bra, blir rätt nöjd, texten växer.. Men jag antar att samma sak kommer att hända imorgon igen.

Är det en brist på tålamod måhända? Att omsorgsfullt formulera om, lägga till och fila på en text är arbetsamt och trist. Men så otroligt nödvändigt för att det ska bli bra.