« Previous : 1 : 2 : 3 : 4 : 5 : Next »

생물학 관련 워크플로우 관리 도구

Workflow Management System이란?
The software component taht "defines, manages and executes worflows through the execution of sotware whose order of execution is driven by a computer representation of wht workflow logic", according to Workflow Managenemt Coalition(WfMC) Reference Model, is named Workflow Management System(WMS).

바이오인포매틱스와 WMS
바이오인포매틱스에서도 Workflow Management System과 것들이 이미 개발되어 bioscientist 들에게 사용되고 있다. 대표적인 WMS들에는 우리가 알고 있는 BioworksBiopipe만 존재하는 것은 아닙니다. 이미 많은 워크플로우 관리 도구들이 논문등을 통해서 발표되어 있으며, 현재 지속적으로 유지 관리되고 있는 워크플로우 관리도구는 적어도 TavernaKepler 그리고 요즘 한창 논문이 나오고 있는 BioWMS 정도가 아닐까 생각됩니다. 그럼 이제부터 각각의 WMS에 대해서 살펴보도록 하겠습니다. 옛말에 적을 알고 나를 알면 백전백승이라고 하지 않았겠습니까?

Standard Process Definition Language - XPDL, BPEL, SCUFL
그전에 한가지 이러한 WMS의 핵심이라고 할 수 있는 어떠한 작업을 수행하는 일련의 프로세스를 정의하는 언어에 대해서 짚고 넘어가야 하겠습니다. 현재 WfMC(Workflow Management Coalition)OASIS(Organization for the Advancement of Structured Information Standards)에서는 각각 XPDL(XML Process Definition Language, v2.0)와 BPEL(Business Process Execution Language, v2.0)라는 XML 기반의 Standard Process Definition Language를 발표한 상태입니다. 공교롭게도 둘다 현재 버전이 2.0입니다. ^^;; 여기에 Taverna에서 사용하는 scufl(Simple Conceptual Unified Flow Language)이 있습니다. 이 부분에 대해서는  Why does Taverna use scufl and not BPEL? 부분에 왜 Taverna에서 BPEL을 사용하지 않고 scufl을 사용했는지에 대한 언급이 나와 있습니다.

Taverna WorkBench - a tool for the composition and enactment of bioinformatics workflows
홈페이지 : Taverna Workbench
Type : Stand-alone
XML : XScufl, SCUFL
Dristribute type : Open Source
Country : UK
Summary : 생물학 웹 서비스(Web Service)를 기반으로Biomart, Biomoby, Soaplan, styx Grid, Talisman과 R 스크립트 및 Beanshell을 통한 사용자 정의 서비스들을 사용할 수 있다. 웹 서비스를 사용하는 워크플로우 표준인 BPEL을 사용하지 않고 생물학 워크플로우에 최적화된 SCUFL( Workflow input, Workflow output, Web service processor, Soaplab processor, Local processor, String processor, Data link의 컴포넌트로 구성)를 사용하고 있다. 공개된 웹 서비스를 통해 왠만한 서비스의 사용이 가능하지만 pegasys, wildfire와 같이 연구실내에 구축된 클러스터 자원을 사용하기 위해서는 해당 서비스에 대한 웹 서비스를 생성하여 사용해야만 한다.

다음의 두가지 FAQ를 통해 이렇게 혼재된 WMS시장에 왜 Taverna가 또 등장했는지에 대한 명확한 해답을 주고 있다.
Why does Taverna use scufl and not BPEL?
When should I use Kepler instead of Taverna?

Kepler - Scientific Workflow Management
홈페이지 :Kepler
Type : Stand-alone
XML : MoML
Dristribute type : Open Source
Country : US
Summary : 2004년부터 2007년 현재까지 지속되어온 프로젝트로 1.0 Beta3 버전까지 나온 상태이다. 웹 서비스를 비롯하여 Grid job 스케줄링에 이르기까지 많은 기능을 가지고 있다. Tavern와 Kepler의 서로간의 영역에 대한 해답은 When should I use Kepler instead of Taverna?

BioWMS : a web-based Workflow Management System for bioinformatics
홈페이지 : BioWMS
Type : Web Interface
XML : XPDL
Dristribute type : Open Source
Country : Italy
Summary : 2007년도 가장 최근에 발표된 WMS로 XfMC의 표준인 XPDL을 이용하고 있다. 한가지 주목할 점은 웹 기반의 워크플로우 편집(XPDL작성)을 지원하고 있다는 점이다. 워크플로우의 프로세스를 WebWFlow의 웹 기반 에디터를 통해 XPDL로 프로세스를 작성하면 XpdlCompiler를 통해 Hermes 워크플로우 엔진을 통해 정의된 프로세스를 수행하게 된다. Hermes middleware는 GUI를 통해 관리자와 시스템의 모니터링을 지원한다.

Pegasys : executing and integrating analyses of biological sequences
홈페이지 : Pegasys
Type : Stand-alone
XML : Peagsys DAG
Dristribute type : Open Source
Country : Canada, UBC Bioinformatics Centre
Summary : 2005년도에 버전 0.6을 발표로 현재 관리되고 있지 않은 듯 보인다. Pegasys 서버/클라이언트로 구성되며, Pegasys 서버에는 postgresql, OpenPBS, Sun Grid Engine(SGE), java 등이 설치되어서 생물학 분석도구(RepeatMarker, NCBI BLAST, WU-BLAST, exonerate, EMBOSS, genscan, HMMgene, InterProScan, Mlagan, Sim4, TrnaScan-SE, Twinscan, GeneSplicer)를 수행할 수 있는 환경을 갖추게 되고 이를 Pegasys 클라이언트에서 사용하는 형식으로 되어 있다. 수행되는 프로그램에서 알 수 있듯이 생물학적 서열을 분석하는데 특화 되었다고 볼 수 있다. 서버(클러스터 환경)를 설정해야 사용 가능하다는 단점이 있다. 재미있는 점은 클라이언트에서 자신이 formatdb를 이용하여 직접 blast db를 생성하는 워크플로우의 작성도 가능하다는 것이다. 즉 서버에서 할 수 있는 모든 일을 클라이언트에서 워크플로우 형태로 작동이 가능하다는 것이다.

Wildfire - distributed, Grid-enable workflow construction and execution
홈페이지 : Wildfire
Type : Stand-alone
XML : GEL(Grid Execution Language)
Dristribute type : Open Source
Country : Singaporem,
Summary : 2005년도에 발표된 것으로, pegasys와 같은 Client/Server(GEL 스크립트 해석기+스케줄러+EMBOSS) 구조로 되어 있다. server는 기본적으로 EMBOSS가 설치된 SMP 서버나 클러스터(LSF, PBS의 스케줄러)나 Grid(condor,SGE 스케줄러)의 스케줄러를 이용하여 EMBOSS의 프로그램들을 사용할 수 있다. 이때 사용자는 워크플로우를 클라이언트에서 작성하면 이는 GEL 언어로 작성되어 서버에서는 GEL 스크립트를 위에서 언급한 스케줄러를 통해 수행하게 된다. Wildfire의 장점은 서버의 다양한 스케줄러를 통해 대량의 생물학 관련 작업을 수행할 수 있다는 점이다.

Biopipe(Beta)
홈페이지 : http://www.biopipe.net
Type : Web Interface
XML : ?
Dristribute type : ?
Country : Korea

Bioworks(Beta)
홈페이지 : http://bioworks.kisti.re.kr
Type : Stand-alone
XML : ?
Dristribute type : ?
Country : Korea
Summary : Bioworks 소개란에 보면 "Bioworks 시스템은 XML 기반의 워크플로우를 모델링하기 위한 Workflow Builder와 작성된 XML을 검증/실행하는 Workflow Engine으로 구성되어 있다."라고 되어 있습니다. WMS에서 워크플로우를 XML 기반으로 작성하고 그 XML을 실제 실행하는 Engine 부분이 바로 핵심이라고 할 수 있을 것입니다. 여기에서 바로 WMS의 특징이 결정될거구요. 과연 어떻게 XML로 복합한 워크플로우 프로세스를 기술하고 이를 실행할 것인가가 중요한 문제인데, 아직까지는 그 실체를 알 수 없습니다. Bioworks는 XML 정의가 어느 정도 이루어져 있는지 궁금하네요.

Bioclipse: An open source workbench for chemo- and bioinformatics
홈페이지 : http://www.bioclipse.net/
Type : Stand-alone(Eclipse RCP base)
Summary : 워크플로우 관리 도구는 아니지만, 다양한 plugin을 통한 개발이 가능하다는 것 하나로 여기에 포함한다. ^^

Posted by hongiiv

2007/12/03 17:50 2007/12/03 17:50
, , , , , , , , , , , , , ,
Response
No Trackback , No Comment
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/280

새로운 협엽의 길을 열다. SciVee

이제는 동영상을 이용하는 연구 커뮤니티 입니다. 바로 SciVee 서비스가 이것을 가능하게 하고 있습니다. SciVee에 대한 내용은 Agile2Robust 블로그에 자세한 설명이 나와있으니 참고 하시기 바랍니다. 한마디로 과학계의 Youtube라고 하는 서비스입니다. 이미 Taverna의 메일링 리스트에 언급되고 있어서 한번 가서 본적이 있는데, 정말 이런 서비스를 가능하다는 것 자체가 놀라울 따름입니다.

welcome

about_img

아래 내용은 The BRCA1/2 pathway prevents hematologic cancers in addition to breast and ovarian cancers 라는 논문의 pubcast입니다. podcast가 아니고, pubcast ^^ 논문의 저자가 막 나오고 하니깐 참 흥미롭네요 ^^



Posted by hongiiv

2007/11/29 15:18 2007/11/29 15:18
,
Response
No Trackback , 2 Comments
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/279

당신의 연구를 위해서는 Blog를 시작해라!

Bio::Blogs #16 - Halloween edition에 보면 "연구를 위해서 Blog를 시작하라"는 인용을 시작으로 Three stories about science and the web에 대해서 언급하고 있습니다. 간단하게 말하자면 과학(bioinformatics and computational biology)분야에서 웹을 사용하여 효과적인 연구활동을 위해 필요한 것들에 대해 말하고 있습니다.

한번은 google과 naver등의 search를 통해서 국내의 bioinformatics and computational biology 분야에 대한 blog 글들을 찾아 보았더랬습니다. 기초적이건 세부적이건간에 그리 많지 않은 blog가 있을 뿐이었습니다.

반면 외국에서는 자신의 연구분야와 관련한 다양한 주제에 대한 blog 글들이 존재했었습니다. 자신이 현재 처한 상황과 에피소드, tip(?)들을 통해 다양한 분야와 다양한 사람들과 의견을 나누고 있었습니다. 단지 부럽다는 생각밖에는 들지 않더군요. 아무리 Bioworks나 Biopipe가 사용자들의 참여를 유도하려고 하고는 있지만, 이렇게 자발적으로 활발히 움직이고 있는 외국의 blog들을 보면서 우리도 차츰차츰 이러한 문화가 자리잡아 가지 않을까?하는 생각을 해보게 됩니다.

간단한 일상을 기록하던 blog가 이제는 하나의 문화가 되었고, 다양한 모델로 변화하고 있는 상황에서 국내 연구자들의 다양한 주제에 대한 blog 문화가 생겨났으면 좋겠습니다.

또 두서없이 써버렸네.. ^^ 다음에 좀 정리해서.ㅋㅋ


Posted by hongiiv

2007/11/29 00:15 2007/11/29 00:15
, ,
Response
No Trackback , 6 Comments
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/277

OBF(Open Bioinformatics Foundation)

OBF(Open Bioinformatics Foundation)은 바이오인포매틱스분야의 공개 소스 프로그래밍을 지원하는데 초점을 맞추고 자발적으로 운영되는 비영리 단체이다. 이 단체는 자발적인 프로젝트인 Bioperl, BioJava, BioPython에서 생겼고, 하드웨어 소유를 위한 적당한 조건들과 도메인 네임 관리, 컨퍼런스와 워크샵을 위한 기금마련 등을 처리하기 위해 통합되었다.

OBF의 주요한 활동은 다음과 같다.
  • BOSC(Bioinformatics Open Source Conference) 컨퍼런스를 승인하고, 개최한다.
  • 미래의 ‘hackathon’ 이벤트를 승인하고, 개최한다.
  • 서버와 설비, 은행 계정, 도메인 네임과 같은 자산들을 관리한다.
미국의 Delaware주에 비영리 법인으로 조직되어 있고, 501(c)(3) 비영리 단체로써 세금을 면제받기 위해 IRS(Internal Revenue Service)에 의지하는 어플리케이션을 가지고 있다.

현재 진행중인 프로젝트로는 다음과 같은 것들이 있다. BioPerl, BioJava, Biopipe, BioPython, BioRuby, EMBOSS, BioDAS(Bio Distributed Annotation system), BioMOBY : 생물학 데이터의 표현, 분배, 발견을 위해 여러 가지 방법론들을 탐구하는 것을 목표로 하는 생물학 데이터 호스트, 생물학 데이터 서비스 제공자와 코더를 포함하는 국제적인 연구 프로젝트, OBDA : 여러 가지의 Open-Bio 프로젝트들 간의 협력 프로젝트이다.

Posted by hongiiv

2007/11/21 22:03 2007/11/21 22:03
, ,
Response
No Trackback , a comment
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/269

제 1회 Taverna 경진대회

경진대회 꼭 KOBIC이나 KISTI만 하라는 법 있나요?? 제 1 회 Taverna 경진대회 시작합니다. ^^;;

문제
여기를 누르시거나(마우스 오른쪽 버튼을 눌러서 다른이름으로 저장을 선택해서 저장 ^^) 또는 여기를 누르셔서(myExperiment에 계정을 만들고 로그인하셔야 다운로드 가능) 워크플로우 xml 파일을 다운로드 받으실 수 있고요. 실행해 보면 제 여자친구와 저의 아주 뜨거운 사진을 볼 수 있습니다. 따라서 미성년자는 대회 참가를 허락합니다. ㅎ

얼른 Taverna를 다운받으시고 위의 워크플로우 파일을 실행시켜 보세요. 실행시킨 Taverna결과를 캡쳐해서 보내주시면 됩니다.

상품
추첨하여 소정의 경품(?)을 드리겠습니다. 아직 기념품은 확정되지 않았습니다. 기대해 주세요 ^^;; (경품이 확정되는데로 댓글로 올리도록 하겠습니다.)

메일
hongiiv (골뱅이) gmail.com

혹 돌맞거나 참가자가 없을 수도 있겠네 ㅎㅎㅎ ^^;; 참가하신분들은 댓글 부탁드립니다.


Posted by hongiiv

2007/11/16 18:03 2007/11/16 18:03
, ,
Response
No Trackback , 2 Comments
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/261

Bioworks 시나리오 공모

bioworks_event41

한다고는 했지만 이렇게 빨리 시나리오 모집 이벤트를 할 줄은 몰랐습니다. ^^;; 150만원 상당의 노트북 보다 상금이 더 땡기는 이유는 뭘까요??


Posted by hongiiv

2007/11/15 18:28 2007/11/15 18:28
,
Response
No Trackback , No Comment
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/259

myExperiment 오픈 베타 시작

myexperiment

myExperiment에 대해서는 저번 포스팅에서 언급했듯이 한마디로 워크플로우 기반 협업을 위한 커뮤니티이다. 물론 Taverna를 기반으로하는...

그동안 클로즈베타 서비스를 수행중이었는데, 오늘 메일링 리스트에 드디어 오픈 베타를 실시한다고 한다. 모두들 가입하셔서 한번 둘러보시는것도 괜찮을 듯 합니다.

클로즈베타에서는 openid만을 지원했는데 이제는 일반 로그인도 가능한가 봅니다. 기능상에는 큰 차이는 없어 보이나 UI가 많이 바뀌었습니다. 솔직히 클로즈베타때는 별로 안이뻐서 ㅋㄷㅋㄷ

시간이 나면 좀 더 둘러봐야겠습니다. 요즘 Bioworks 후기도 작성해야 해서 돌아다닐 시간이 별로 없네요 ^^;;

Posted by hongiiv

2007/11/14 09:27 2007/11/14 09:27
, ,
Response
No Trackback , No Comment
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/257

영국의 대표적인 workflow인 TavernaKOBIC의 BioPipe 그리고 하나더 국내에서 발표되었습니다. 바로 Bioworks가 KISTI에서 태어났습니다.

요즘은 아무리 서비스를 내놓기 전에 Beta가 유행이지만, 역시 Bioworks도 베타버전입니다. 지금 등록된 서비스는 Alignment, DNA Analysis, Protein Analysis, Utils의 크게 4개 분야로 되어있습니다. 기존에 KISTI의 CCBB에서 제공하던 서비스들인 것 같습니다. CCBB에서 제공하던 서비스들은 제대로 잘 안돌아 가던데 Bioworks에서는 잘 돌아갈런지 ^^;; KISTI의 막강한 슈퍼컴퓨팅 파워와 네트워크 파워가 잘 어우러진다면 이것도 꽤 쓸만하겠는데요,,,

Java로 만들어진 어플리케이션이고 현재는 Java WebStart 형태로 구동되고 있더군요. 간혹 제대로 실행되지 않을때도 있고요. 아직 많은 홍보는 이루어지지 않고 있는것 같고요 저도 지인의 도움으로 알게 되었습니다.

Bioworks 홈페이지 http://bioworks.kisti.re.kr
bioworks

Bioworks에 등록된 서비스들 - 주로 기존의 KISTI CCBB에서 제공하던것들
works_services

Taverna와 아주 유사한 UI를 가지고 있고요 기존의 Taverna와 BioPipe 유저라면 사용하는데에는 큰 무리가 없을거 같습니다. 아직 좀 더 둘러보고 다음번에 포스팅하도록 하지요.

참고로 로그인 유저아이디와 암호는 demo/12345678입니다. 홈페이지에도 나와 있듯이 말입니다. ^^;;

KOBIC의 Biopipe의 막강한 라이벌이 등장한것 같습니다. 저도 Taverna에 대한 Plugin을 개발하고 있는데,, 이거 KOBIC의 압박이 점점 심해지겠는걸요 ^^ 미천한 제생각으로는 둘이 합치면 좋을것 같은데 절대 그럴리는 없겠죠 ㅋㄷㅋㄷ

Posted by hongiiv

2007/11/06 17:45 2007/11/06 17:45
, , , , , ,
Response
No Trackback , 4 Comments
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/251

DDBJ 웹 서비스

DDBJ(DNA Data Bank of Japan)는 일본국립유전학연구소(National Institute of Genetics) 산하 기관으로 DNA 염기서열의 데이터베이스를 유럽의 EMBL, 미국의 GenBank와 함께 구축하여 제공하고 있다. DNA 데이터는 DDBJ, EMBL, GenBank중 하나에 등록되지 않으면 저널에 수록되지 않으며 이 3개 기관은 신속하게 처리해 갱신하는 역할을 하고 있다.<표 1>은 DDBJ에서 제공하고 있는 주요 웹 서비스를 보여주고 있다.

표 1. DDBJ에서 제공하는 주요 웹 서비스
1

웹 서비스가 나온지 오랜 시간이 지났지만 아직까지 활발히 사용되지 않고 있는건 아마도 사용하기 까다롭기 때문일 것이다. DDBJ에서는 이러한 어려움을 줄이고 좀더 손 쉬운 방법으로 서비스를 제공하고 있는데 바로 REST(Representational State Transfer) 방식이다. REST는 WWW 인터넷 프로토콜을 통해 XML 문서를 전송하여 애플리케이션을 구축하는 방식으로 개발자들은 HTTP 연결이 지원되는 웹 브라우저나 프로그래밍 언어만을 사용해서 간단하게 프로그래밍이 가능하다. DDBJ는 현재 웹 서비스 형태로 제공되어지는 모든 서비스에 대해서 REST 방식으로도 제공하고 있다. 이번에는 웹 서비스 대신 REST 방식으로 서비스를 호출하여 사용해보도록 하겠다.

DDBJ 에서 REST를 사용하는 방법은 URL과 서비스명, 호출하고자하는 메소드와 인자를 호출하는 방식으로 <리스트 1>과 같다. GetEntry 서비스의 getDDBJEntry 메소드는 DDBJ 데이터베이스의 accession number를 가지고 해당 정보를 Fasta 포맷으로 가져오는 메소드로 accession number가 AB000100에 대한 정보를 가져오는 REST를 호출하면 <리스트 2>와 같다.

리스트 1. DDBJ에서 REST 호출 방식
http://xml.nig.ac.jp/rest/Invoke?service=서비스명&method=호출하고자하는메소드&파라메터들...

리스트 2. AB000100에 해당하는 DDBJ 정보를 가져오는 REST 호출
http://xml.nig.ac.jp/rest/Invoke?service=GetEntry&method=getDDBJEntry&accession=AB000100

이제 이 호출을 HTTP를 지원하는 웹 브라우저를 통해 Post 방식으로 보내거나 Perl, Java, Ruby 등의 프로그래밍 언어를 통해 Post 방식으로 보내면 되기 때문에 SOAP 방식의 웹 서비스에 비해 간단하게 프로그래밍을 할 수 있다. <리스트 3>은 해당 질의 정보를 Post 형태로 보내고 그 결과를 보여주는 Python 코드로 HTTP 헤더 정보와 POST 방식의 Request를 만들어 보내는 간단한 코드로 구성되어 있다.

리스트 3. AB000100에 해당하는 DDBJ 정보를 가져오는 Python 프로그램 (rest.py)
      import httplib, urllib

      con = httplib.HTTP('xml.nig.ac.jp')
      params = urllib.urlencode(
        {'service':'GetEntry', 'method':'getDDBJEntry', 'accession':'AB000100'})

      con.putrequest('POST', '/rest/Invoke')
      con.putheader('Host', 'xml.nig.ac.jp')
      con.putheader('User-Agent', 'python/socket')
      con.putheader('Content-type', 'application/x-www-form-urlencoded')
      con.putheader('Content-length', '%d' % len(params))
      con.endheaders()

      con.send(params)

      code, msg, header = con.getreply()
      r = con.getfile().read()

      print r
      con.close()

Posted by hongiiv

2007/10/25 09:34 2007/10/25 09:34
, ,
Response
No Trackback , No Comment
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/246

Iteration methods and strategies in Taverna

Taverna에서는 묵시적이지만, 설정이 가능한 iteration 메커니즘을 가지고 있다. processor가 하나의 list를 입력으로 받으면 여러번 processor가 수행되어 그 결과를 새로운 list로 받을 수 있다.  이러한 iteration은 cross와 dot이 존재한다.

iteration

첫 번째는 a 하나만을 입력으로 받아서 function f를 수행하고 나면 결과로 f(a)를 받는 일반적인 상황이고, 첫 번쨰 하단은 입력으로 리스트 [a1,a2,a3]를 받아서 결과로 묵시적인 iteration이 발생해서 각각의 입력에 대해 하나씩 수행된 상황이다.

이제 cross와 dot strategy가 발생하는 상황인데, 첫 번째 cross는 입력으로 [a1,a2] [b1,b2]를 받으면 두개의 list가 cross로 대응해서 (a1,b1),(a1,b2),(a2,b1),(a2,b2)가 결과로 나온다. 반면 dot은 입력으로 [a1,a2][b1,b2]를 받으면 리스트당 한번씩만 대응해서(?) (a1,b1)(a2,b2)가 결과로 나오게 된다. 이러한 iteration을 활용해서 processor를 몇번, 어떻게 수행할지를 사용자가 정의할 수 있다.

예를 들어 두 개의 문자를 입력으로 받아 서로 합치는 processor가 있다고 할 때에 첫번째 입력으로 [우리,나라]를 두번째 입력으로 [대한,민국]를 주면 dot인 경우 결과는 [우리,대한][나라,민국]가 나오면서 총 2번 processor를 수행하게 된다. cross인 경우에는 결과는 [우리,대한][우리,민국][나라,대한][나라,민국] 총 4번 processor가 수행되게 된다.

Posted by hongiiv

2007/08/31 14:01 2007/08/31 14:01
, , , ,
Response
No Trackback , No Comment
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/227

Bioclipse: an open source workbench for chemo-and bioinformatics

요약
Background: 화학-바이오인포매틱스(chemo- and bioinformatics) 연구에 필요한 단일의 워크벤치(singel workbench)로부터 소프트웨어 어플리케이션이 필요하다. 상업 패키지(commercial packages)의 경우 비용과 소스의 비공개(closed source) 문제가 있다. 따라서 알고리즘을 교체(modify algorithms)하거나 기능(custom functionality)을 추가하는데 문제가 있다. 본 오픈소스 프로젝트(existing open source projects)는 사용하기 쉬운 인터페이스(user-friendly) 보다 독립되어 설치된 바이오인포매틱스 패키지를 통합을 위한 프레임워크에 초점이 맞추어 있다. 이전에 개발된 오픈 소스의 chemoinformatics 워크벤치는 chemo-와 바이오인포매틱스를 하나의 프레임워크로 완벽하게 결합시지 못했다.

Result: Bioclipse는 분자(molecules), 단백질(proteins), 서열(sequence), 분광(spectra), 스크립트와 같은 화학- 바이오인포매틱스 리소스를 위한 워크벤치이다. Bioclipse는 2D-편집, 3D-시각화, 파일 포맷 변경, 화학적 속성 계산, 그 외 다 수의 기능을 제공한다. 편집시 자르기, 붙이기, 드래그 앤 드롭, 되돌리기, 다시실행 같은 표준 편집 기능을 제공한다. Bioclipse는 자바와 Eclipse Rich Client Platform의 최고의 플러그인 아키텍처를 기반으로 만들어졌다. Bioclipse는 원하는 방향으로 손쉽게 확장 가능하다는 장점이 있다.

Conclusion: Bioclipse는 바이오- chemoinformatics를 위한 강력한 워크벤치이다. 풍부한 기능, 직관적인 사용자 인터페이스, 강력한 플러그인 아키텍처는 Bioclipse를 chemo- 바이오인포매틱스를 위한 가장 진보적이고 사용하기 쉬운 오픈 소스 워크벤치로 만들었다. Bioclipse는 외부 플러그인에 대한 제약이 없는 Eclipse Public License(EPL)의 오픈 소스 라이선스를 가지고 있다.

Backuground

Implementation
  Architecture
  Object model
  User interface

Result and discussion
  Features
    Chmoinformatics
    Bioinformatics
    Web services
    Spectrum analysis
    Scripting
    Sample data

Conclusion
  Bioclipse as workbench
  Bioclipse as integration framework
  Bioclipse as development envronment
  Bioclipse as deployment platform
  Future developemnt

Posted by hongiiv

2007/07/27 15:25 2007/07/27 15:25
, , ,
Response
No Trackback , No Comment
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/210

Bioclipse: an open source workbench for chemo- and bioinformatics, Ola Spjuth1, 2007, BMC Bioinformatics.

다들 알고 있겠지만 Eclipse는 단지 자바나 기타 프로그래밍 언어를 위한 통합개발환경(IDE)이 아니라, 툴의 통합을 위한 공개 플랫폼이다. 다시 말해서 Eclipse는 상이한 툴들이 끊김없는 유저 인터페이스를 가진 단일 통합 어플리케이션으로 합치기 위한 프레임워크를 제공한다.

Eclipse RCP는 Eclipse가 단순히 개발툴인 아닌 어플리케이션 플랫폼으로 활용할 수 있도록 정의된 것으로 Eclipse는 SWT를 기반으로 GUI 플랫폼의 독립성을 확보하고, 그 위에 수많은 플러그인이 합쳐진 결과가 Eclipse이다. 독립적인 어플리케이션(Stand-alone Application)에 필수적인 요소들을 뽑아 구성한 것이 RCP로 Eclipse 자체도 RCP로 구현된 첫번째 어플리케이션인 셈이된다.

이러한 RCP는 Eclipse가 동작하는 모든 플랫폼에서 사용가능한 GUI  어플리케이션 개발이 가능하다. 일반적인 Java 어플리케이션과는 달리 SWT를 기반으로 하기 때문에 Swing에 비해 빠르고 강력하다. 또한 Eclipse 플로그인 아키텍처를 사용하므로 다양한 플러그인을 어플리케이션에서 활용할 수 있다.

이러한 Eclipse RCP를 이용한 Bioinfromatics 어플리케이션이 나왔으니 바로 Bioclipse이다. Eclipse 홈페이지에 Open Source Rich client platform(RCP) applications 에도 소개되어 있다.

사용자 삽입 이미지

Bioclipse는 CDK-plugin과 Jmol-plugin을 사용하여 서로 다른 포맷의 파일의 Import/Export하고 분자의 2D 구조를 편집하고 분자나 단백질의 3D-visualization과 DNA, RNA, 단백질등의 서열의 편집하고 visualization을 수행할 뿐만 아니라 PDB파일을 다루는 등 많은 기능을 가지고 있다. 이렇듯 화학이나 Bioinformatics 연구를 수행하는 연구자에게 아주 유용한 기능들을 제공하고 있다.

문제는 단순히 하나의 툴을 소개하려는 것이 아니라 Eclipse라는 공개된 플랫폼을 이용한 Open Source 어플리케이션이라는 점이다. 다음번에 한번 언급하겠지만, Taverna나 Bioclipse를 보면서 참여와 공유, Open Source라는 단어가 과학계에도 힘차게 불어오고 있다는 점이다.



Posted by hongiiv

2007/07/27 10:43 2007/07/27 10:43
, , , , ,
Response
No Trackback , 2 Comments
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/209

과학적인(Bioinformatics) 문제를 풀기 위한 일반적인 과정은 다음과 같다.

Step 1 : Figure out what it is you wnat to do.
어떠한 문제를 해결하고자 할것인지, 다루는 데이터와 해야할 일에 대해 생각하는 단계이다.

Setp 2: Conceptualize the flow of data and the individual steps in the process.
어떠한 알려진 DNA, RNA, protein 서열로 부터 인간의 진화적인 관련성을 결정하기 위한 과정을 다음과 같이 나타낼 수 있다.

step1

Setp 3. Identify sources, and applications or services to perform each setp.

각 단계마다 필요한 데이터나 도구, 서비스를 결정하는 단계이다.

step2

Setp 4. Make some decisions on the details.

어떠한 서열 데이터베이스를 찾을 것인지, 검색 파라메터는 어떻게 할것인지, 어떠한 메소드를 사용하여 phylogeny를 정의 할지, 어떠한 트리 모양으로 보여줄 것인지 등을 결정하는 단계로 각 서비스나 도구들의 옵션을 설정하는 과정이라고 보면 되겠다.

Setp 5. DO the work.
이 단계에서 워크플로우를 만들고 실행한다.

Posted by hongiiv

2007/07/26 15:10 2007/07/26 15:10
, , , , , , ,
Response
No Trackback , No Comment
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/207

저번 포스팅에서더 잠깐 언급했지만 드디어 myexperiment가 클로즈 베타 테스트를 실시하고 있습니다. 메일을 보냈더니 2~3일 후에 접근 권한을 주는 메일이 와서 어제 한번 쭉 둘러보았다.

myexperiment는 작게 보면 Taverna라는 워크플로우 디자인 도구의 결과물(일련의 실험 과정)을 서로 공유하는 web2.0스러운 bio science 관련 웹페이지라고 보면 될것이다.

Taverna는 가장 대중적인 웹 서비스 워크플로우 디자인 도구로서 EPSRC(Engineering and Physical Sciences Research Council)의 펀드의 myGrid 프로젝트의 일부로서 GNU Lesser General Public License(LGPL) 하에서 자유롭게 사용이 가능하다. 또한 세계적 프로젝트인 BioMoby 사용자들을 위한 사실상 표준적인 클라이언트 어플리케이션으로 자리 잡고 있다.

myexperiment는 OpenID를 통해서 로그인할 수 있도록 되어 있으며, 크게 My, People, Projects, Workflows, About의 5개의 주메뉴로 구성 되어 있었다.

Picture 11.jpg
myexperiment 첫화면

Picture 12.jpg
myexperiment 로그인된 화면 상단의 주메뉴가 보인다.

My 메뉴에서는 자신의 프로필과 자신의 친구(?)관리, 자신이 등록한 워크플로우관리, 프로젝트,포럼, 블로그들을 생성하고 관리할 수 있다.

Workflows 메뉴에는 다른 사람들이 업로드한 워크플로우의 다이어그램과 함께 다운로드 받을 수 있어 바로 Taverna를 통해 실행 할 수 있도록 하는 한편 각각의 워크플로우는 워크플로우에 대한 소개, 다이어그램, 태그, 코멘트를 남길 수 있도록 했다. 뿐만 아니라 Tag Cloud까지 제공하여 Web2.0의 냄새가 물씬 풍기도록 했다.

Picture 14.jpg
등록된 EBI InterProScan 워크플로우

Picture 15.jpg

등록된 워크플로우에 대한 Tag Cloud

Picture 13.jpg

현재 등록된 워크플로우들 - 아직 클로즈 베타 테스트기간이라 많은 수의 워크플로우가 등록되어 있지 않다.

아직 베타테스트기간이라 많은 수의 프로젝트나 워크플로우를 공유할 수는 없지만, 이 사이트가 활성된다면 생물학자들에게 많은 도움이 될 수 있을 거라고 확신한다. 다른 한편으로는 이러한 Web2.0의 바람이 생물학등의 과학분야에도 널리 퍼져 공유의 꽃을 피웠으면 하는 바램이다.

간단하게 myexperiment에 대해서 살펴보았다. 해외에서는 클러스터를 이용한 Grid를 구축하고 이를 생물학에서 활용하기 쉽게 하기 위해 BioMoby등의 웹 서비스를 제공하는 한편, 이를 과학자들이 쉽게 사용하기 위한 Taverna와 같은 도구를 만들고 이에 멈추지 않고 myexperiment와 같이 자료를 공유할 수 있는 장의 만들고 있는데, 국내에서는...



Posted by hongiiv

2007/07/26 14:18 2007/07/26 14:18
, , , ,
Response
No Trackback , No Comment
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/206

논문을 정리하자 - papers 1.1

논문을 정리하고자 할때 많이 쓰는 EndNote보다 휠씬 이쁜 papers로 논문을 정리하는 중...
다운로드는 여기

paper 1.1

Posted by hongiiv

2007/06/13 20:03 2007/06/13 20:03
, ,
Response
No Trackback , 3 Comments
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/199

질병정보를 한눈에 보자!!

좀전에 healthmap에 대해서 간단하게 포스팅했는데, 마지막 질병 시리즈로 질병정보를 일반인들이 알기 쉽게 설명한 사이트 하나 소개하려 한다. 질병관리본부에서 제공하는 질병정보지식포탈 서비스



인체별, 연령별, 주제별, 관심질병의 카테고리로 각각의 질병에 대한 정보를 제공할 뿐만 아니라, e-book을 통한 정보를 제공하고 있다. 한번쯤 들려서 질병에 관한 내공을 쌓는것두..^^;;

Posted by hongiiv

2007/05/28 20:32 2007/05/28 20:32
, , , , ,
Response
No Trackback , No Comment
RSS :
http://socmaster.homelinux.org/~hongiiv/rss/response/195

« Previous : 1 : 2 : 3 : 4 : 5 : Next »


야후 블로그 벳지


Site Stats

Total hits:
291985
Today:
155
Yesterday:
234