본문 바로가기
Bioinformatics/Technology

Sun Grid Engine 병렬 환경 사용하기 qlogin

by 임은천 2013. 6. 5.

본 내용은 https://forums.oracle.com/forums/thread.jspa?messageID=9588718의 내용을 참고했다.


우선 먼저 해야 하는 것은 주어진 그리드 엔진에서 어떤 병렬 처리 환경이 제공되는지 알아야 한다. 그러므로 다음과 같은 명령으로 사용할 수 있는 병렬 처리 환경을 확인한다.


qconf -spl


끝은 'L' 소문자이다.


$ qconf -spl

openmpi

parallel


내가 있는 연구소에서는 openmpi와 parallel이라는 이름으로 병렬 환경을 제공한다.


다음으로 각 환경이 무엇을 지원하는지 확인해 보자.


qconf -sp <병렬 환경 이름>


위 명령을 이용해서 좀더 자세한 내용을 확인할 수 있다.


$ qconf -sp openmpi

pe_name            openmpi

slots              999

user_lists         NONE

xuser_lists        NONE

start_proc_args    /bin/true

stop_proc_args     /bin/true

allocation_rule    $round_robin

control_slaves     TRUE

job_is_first_task  FALSE

urgency_slots      min

accounting_summary FALSE


$ qconf -sp parallel

pe_name            parallel

slots              9999

user_lists         NONE

xuser_lists        NONE

start_proc_args    /bin/true

stop_proc_args     /bin/true

allocation_rule    $pe_slots

control_slaves     FALSE

job_is_first_task  TRUE

urgency_slots      min

accounting_summary FALSE


위와 같은 결과를 얻을 수 있었다. 다음으로 qlogin 작업을 제출해 보자.


qlogin 다양한 옵션들


위의 명령은 인터렉티브하게 명령을 노드에서 수행할 수 있다. 말하자면, 쉘로 연결한 것처럼 보이게 된다.


$ qlogin -pe parallel 32 -l h_vmem=128g -now n

Your job 483515 ("QLOGIN") has been submitted
waiting for interactive job to be scheduled .........


위의 옵션에서 32개의 코어와 128G의 메모리, 그리고 해당 자원이 찾아질 때까지 계속 기다리는 옵션을 적었다. 어떤 작업이 현재 제출되어 있는지 확인하려면 qstat, qhost를 이용하면 된다.


qstat

qhost


실행하면 다음과 같은 결과를 얻을 수 있다.


job-ID  prior   name       user         state submit/start at     queue                          slots ja-task-ID 

-----------------------------------------------------------------------------------------------------------------

 483515 0.32958 QLOGIN     elim         qw    06/05/2013 12:45:48                                   32        

 483516 0.32956 QLOGIN     elim         qw    06/05/2013 12:46:15                                   32


qlogin을 2개 제출했다. 여기에서 slot은 코어 갯수이다. 여기에 -f 옵션을 추가 하면 좀 더 자세한 상황이 보인다.


$ qstat -f

queuename                      qtype resv/used/tot. load_avg arch          states

---------------------------------------------------------------------------------

long.q@node337                 BIP   0/64/64        61.91    lx26-amd64    

---------------------------------------------------------------------------------

long.q@node401                 BIP   0/6/8          6.04     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node402                 BIP   0/5/8          4.98     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node403                 BIP   0/5/8          6.02     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node404                 BIP   0/4/8          4.01     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node405                 BIP   0/5/8          5.00     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node406                 BIP   0/5/8          5.06     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node407                 BIP   0/5/8          4.99     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node408                 BIP   0/5/8          4.98     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node409                 BIP   0/5/8          5.04     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node410                 BIP   0/5/8          4.99     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node411                 BIP   0/5/8          4.99     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node412                 BIP   0/5/8          4.99     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node413                 BIP   0/6/8          5.01     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node415                 BIP   0/5/8          4.98     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node416                 BIP   0/4/8          4.01     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node418                 BIP   0/5/8          5.01     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node419                 BIP   0/5/8          5.14     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node422                 BIP   0/5/8          4.98     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node443                 BIP   0/45/48        44.97    lx26-amd64    

---------------------------------------------------------------------------------

long.q@node444                 BIP   0/32/48        32.00    lx26-amd64    

---------------------------------------------------------------------------------

long.q@node445                 BIP   0/36/48        163.08   lx26-amd64    

---------------------------------------------------------------------------------

long.q@node446                 BIP   0/38/48        19.66    lx26-amd64    

---------------------------------------------------------------------------------

long.q@node447                 BIP   0/64/64        63.97    lx26-amd64    

---------------------------------------------------------------------------------

long.q@node454                 BIP   0/8/8          8.03     lx26-amd64    

---------------------------------------------------------------------------------

long.q@node501                 BIP   0/64/64        61.88    lx26-amd64    

---------------------------------------------------------------------------------

long.q@node503                 BIP   0/24/64        24.07    lx26-amd64    

---------------------------------------------------------------------------------

long.q@node504                 BIP   0/40/64        38.92    lx26-amd64    

---------------------------------------------------------------------------------

short.q@node336                BIP   0/0/64         0.02     lx26-amd64    

---------------------------------------------------------------------------------

short.q@node414                BIP   0/0/8          0.01     lx26-amd64    

---------------------------------------------------------------------------------

short.q@node417                BIP   0/0/8          0.01     lx26-amd64    

---------------------------------------------------------------------------------

short.q@node420                BIP   0/0/8          0.04     lx26-amd64    

---------------------------------------------------------------------------------

short.q@node421                BIP   0/0/8          0.04     lx26-amd64    

---------------------------------------------------------------------------------

short.q@node502                BIP   0/0/64         0.01     lx26-amd64    

---------------------------------------------------------------------------------

short.q@node505                BIP   0/0/64         0.01     lx26-amd64    


############################################################################

 - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS

############################################################################

 483515 0.32961 QLOGIN     elim         qw    06/05/2013 12:45:48    32        

 483516 0.32959 QLOGIN     elim         qw    06/05/2013 12:46:15    32  


qhost는 다음과 같은 결과를 얻을 수 있다.


$ qhost

HOSTNAME                ARCH         NCPU  LOAD  MEMTOT  MEMUSE  SWAPTO  SWAPUS

-------------------------------------------------------------------------------

global                  -               -     -       -       -       -       -

node336                 lx26-amd64     64  0.08  504.9G    4.0G  558.9G     0.0

node337                 lx26-amd64     64 62.01  504.9G   98.2G   91.9G     0.0

node401                 lx26-amd64      8  6.04   31.5G    8.3G   30.6G    4.2M

node402                 lx26-amd64      8  5.05   31.5G   18.3G   30.6G   25.1M

node403                 lx26-amd64      8  6.00   31.5G    6.3G  139.7G    3.7M

node404                 lx26-amd64      8  4.02   23.6G   10.9G   30.6G   73.7M

node405                 lx26-amd64      8  5.03   31.5G   13.2G   30.6G    6.3M

node406                 lx26-amd64      8  5.01   31.5G   18.3G   30.6G   21.7M

node407                 lx26-amd64      8  4.99   31.5G    8.1G   30.6G    3.3M

node408                 lx26-amd64      8  5.03   31.5G   12.9G   30.6G    4.0M

node409                 lx26-amd64      8  4.99   31.5G   18.2G   30.6G   24.0M

node410                 lx26-amd64      8  4.97   31.5G    8.0G   30.6G    3.0M

node411                 lx26-amd64      8  4.98   31.5G    8.1G   30.6G    3.3M

node412                 lx26-amd64      8  5.03   31.5G   12.9G   30.6G    6.9M

node413                 lx26-amd64      8  5.04   31.5G    8.1G   30.6G    3.4M

node414                 lx26-amd64      8  0.03   31.5G  170.0M   30.6G     0.0

node415                 lx26-amd64      8  5.03   31.5G    8.1G  139.7G    3.6M

node416                 lx26-amd64      8  4.06   27.5G    6.9G   30.6G    3.4M

node417                 lx26-amd64      8  0.03   31.5G  161.7M  139.7G     0.0

node418                 lx26-amd64      8  4.99   31.5G   13.0G  139.7G   21.0M

node419                 lx26-amd64      8  4.99   31.5G    7.8G   30.6G    3.1M

node420                 lx26-amd64      8  0.02   31.5G  128.2M   30.6G     0.0

node421                 lx26-amd64      8  0.02   31.5G  128.5M   30.6G     0.0

node422                 lx26-amd64      8  5.01   31.5G   11.1G   30.6G    4.1M

node443                 lx26-amd64     48 45.01  504.3G  195.7G   30.6G    4.9M

node444                 lx26-amd64     48 31.98  251.8G   82.9G   30.6G   18.3M

node445                 lx26-amd64     48 172.6  252.4G  138.8G   30.6G   12.5M

node446                 lx26-amd64     48 19.45  252.4G   44.5G   91.9G  572.0K

node447                 lx26-amd64     64 64.06  504.9G   87.5G   61.3G    1.7M

node454                 lx26-amd64      8  8.05   62.3G   18.3G  107.2G    2.9M

node501                 lx26-amd64     64 62.02  504.9G   88.7G  558.9G    7.3M

node502                 lx26-amd64     64  0.05  504.9G    1.0G   91.9G     0.0

node503                 lx26-amd64     64 24.05  252.4G  110.9G   91.9G   27.1M

node504                 lx26-amd64     64 38.04  252.4G   61.8G   91.9G   36.6M

node505                 lx26-amd64     64  0.09  252.4G  624.5M   91.9G     0.0


댓글