Job request: 4470

Organisation:: Bennett Institute
Workspace:: long-covid-sick-notes
ID:: iwnnjwxe62e4q5kl

This page shows the technical details of what happened when authorised researcher Alex Walker requested one or more actions to be run against real patient data in the project, within a secure environment.

By cross-referencing the indicated Requested Actions with the Pipeline section below, you can infer what security level various outputs were written to. Outputs marked as highly_sensitive can never be viewed directly by a researcher; they can only request that code runs against them. Outputs marked as moderately_sensitive can be viewed by an approved researcher by logging into a highly secure environment. Only outputs marked as moderately_sensitive can be requested for release to the public, via a controlled output review service.

Jobs

Action:

generate_study_population_covid_2020

Status:

Status: Succeeded

Job identifier:

rmjoclxfvgdfz4yd
Action:

generate_study_population_general_2019

Status:

Status: Succeeded

Job identifier:

zwts67coiaog2nx7
Action:

generate_study_population_pneumonia_2019

Status:

Status: Succeeded

Job identifier:

artcfw4toerzbqit
Action:

generate_study_population_general_2020

Status:

Status: Succeeded

Job identifier:

d53eg7nd6jrwinte
Action:

reconcile_sick_note_spells_pneumonia_2019

Status:

Status: Succeeded

Job identifier:

i3uuho3ckvitxzrg
Action:

pneumonia_2019_rates_cohort

Status:

Status: Succeeded

Job identifier:

drenjsathszxxopp
Action:

pneumonia_2019_rates

Status:

Status: Succeeded

Job identifier:

yuske747ua3cmizc
Action:

rates_over_time

Status:

Status: Succeeded

Job identifier:

tut6c5w7r6yeehqr
Action:

reconcile_sick_note_spells_covid_2020

Status:

Status: Succeeded

Job identifier:

gaffj3czkf6mhmsq
Action:

matching_2020

Status:

Status: Succeeded

Job identifier:

abuuhju44femp4nw
Action:

matching_2019

Status:

Status: Succeeded

Job identifier:

hyaw4enrbdpgducd
Action:

covid_2020_rates_cohort

Status:

Status: Succeeded

Job identifier:

n252tso7s6net7me
Action:

covid_2020_rates

Status:

Status: Succeeded

Job identifier:

pjhgvow6ywsbusns
Action:

reconcile_sick_note_spells_general_2019

Status:

Status: Succeeded

Job identifier:

fhvfkv5up3gt43yw
Action:

general_2019_rates_cohort

Status:

Status: Succeeded

Job identifier:

jso7mkauzqleoxle
Action:

general_2019_rates

Status:

Status: Succeeded

Job identifier:

wyaqdnza5fkfeswo
Action:

reconcile_sick_note_spells_general_2020

Status:

Status: Succeeded

Job identifier:

g67ypnse2xj6rf7j
Action:

general_2020_rates_cohort

Status:

Status: Succeeded

Job identifier:

cxpzgmcbybuxchba
Action:

describe_duration

Status:

Status: Succeeded

Job identifier:

m4hzhkt2hwbctpn4
Action:

general_2020_rates

Status:

Status: Succeeded

Job identifier:

rcwxqcqyged6xfpj
Action:

append_cohorts

Status:

Status: Succeeded

Job identifier:

kepmfzvxohdycbo7
Action:

cox_models

Status:

Status: Succeeded

Job identifier:

zuizmdca2bygaufq

Pipeline

Show project.yaml

version: '3.0'

expectations:
  population_size: 10000

actions:

  generate_study_population_covid_2020:
    run: cohortextractor:latest generate_cohort --study-definition study_definition_covid_2020 --output-dir=output/cohorts 
    outputs:
      highly_sensitive:
        cohort: output/cohorts/input_covid_2020.csv

  generate_study_population_general_2019:
    run: cohortextractor:latest generate_cohort --study-definition study_definition_general_2019 --output-dir=output/cohorts 
    outputs:
      highly_sensitive:
        cohort: output/cohorts/input_general_2019.csv

  generate_study_population_general_2020:
    run: cohortextractor:latest generate_cohort --study-definition study_definition_general_2020 --output-dir=output/cohorts 
    outputs:
      highly_sensitive:
        cohort: output/cohorts/input_general_2020.csv

  generate_study_population_pneumonia_2019:
    run: cohortextractor:latest generate_cohort --study-definition study_definition_pneumonia_2019 --output-dir=output/cohorts 
    outputs:
      highly_sensitive:
        cohort: output/cohorts/input_pneumonia_2019.csv

  matching_2019:
    run: python:latest python analysis/match_running.py "2019" --output-dir=output/cohorts
    needs: [generate_study_population_covid_2020, generate_study_population_general_2019]
    outputs:
      moderately_sensitive:
        matching_report: output/cohorts/matching_report_general_2019.txt
      highly_sensitive:
        matched_cohort: output/cohorts/matched_matches_general_2019.csv

  matching_2020:
    run: python:latest python analysis/match_running.py "2020" --output-dir=output/cohorts
    needs: [generate_study_population_covid_2020, generate_study_population_general_2020]
    outputs:
      moderately_sensitive:
        matching_report: output/cohorts/matching_report_general_2020.txt
      highly_sensitive:
        matched_cohort: output/cohorts/matched_matches_general_2020.csv

  reconcile_sick_note_spells_covid_2020:
    run: python:latest python analysis/reconcile_sick_note_spells.py "_covid_2020" "input"
    needs: [generate_study_population_covid_2020]
    outputs:
      highly_sensitive:
        cohort_with_duration: output/cohorts/input_covid_2020_with_duration.csv

  reconcile_sick_note_spells_general_2019:
    run: python:latest python analysis/reconcile_sick_note_spells.py "_general_2019" "matched_matches"
    needs: [matching_2019]
    outputs:
      highly_sensitive:
        cohort_with_duration: output/cohorts/input_general_2019_with_duration.csv

  reconcile_sick_note_spells_general_2020:
    run: python:latest python analysis/reconcile_sick_note_spells.py "_general_2020" "matched_matches"
    needs: [matching_2020]
    outputs:
      highly_sensitive:
        cohort_with_duration: output/cohorts/input_general_2020_with_duration.csv

  reconcile_sick_note_spells_pneumonia_2019:
    run: python:latest python analysis/reconcile_sick_note_spells.py "_pneumonia_2019" "input"
    needs: [generate_study_population_pneumonia_2019]
    outputs:
      highly_sensitive:
        cohort_with_duration: output/cohorts/input_pneumonia_2019_with_duration.csv

  covid_2020_rates_cohort:
    run: stata-mp:latest analysis/000_cr_define_covariates_simple_rates.do "covid_2020" --output-dir=output/cohorts
    needs: [reconcile_sick_note_spells_covid_2020]
    outputs:
      highly_sensitive:
        analysis_dataset: output/cohorts/cohort_rates_covid_2020.dta

  general_2019_rates_cohort:
    run: stata-mp:latest analysis/000_cr_define_covariates_simple_rates.do "general_2019" --output-dir=output/cohorts
    needs: [reconcile_sick_note_spells_general_2019]
    outputs:
      highly_sensitive:
        analysis_dataset: output/cohorts/cohort_rates_general_2019.dta

  general_2020_rates_cohort:
    run: stata-mp:latest analysis/000_cr_define_covariates_simple_rates.do "general_2020" --output-dir=output/cohorts
    needs: [reconcile_sick_note_spells_general_2020]
    outputs:
      highly_sensitive:
        analysis_dataset: output/cohorts/cohort_rates_general_2020.dta

  pneumonia_2019_rates_cohort:
    run: stata-mp:latest analysis/000_cr_define_covariates_simple_rates.do "pneumonia_2019" --output-dir=output/cohorts
    needs: [reconcile_sick_note_spells_pneumonia_2019]
    outputs:
      highly_sensitive:
        analysis_dataset: output/cohorts/cohort_rates_pneumonia_2019.dta

  covid_2020_rates:
    run: stata-mp:latest analysis/100_cr_simple_rates.do "covid_2020" --output-dir=output/tabfig
    needs: [covid_2020_rates_cohort]
    outputs:
      moderately_sensitive:
        rates: output/tabfig/rates_summary_covid_2020.csv

  general_2019_rates:
    run: stata-mp:latest analysis/100_cr_simple_rates.do "general_2019" --output-dir=output/tabfig
    needs: [general_2019_rates_cohort]
    outputs:
      moderately_sensitive:
        rates: output/tabfig/rates_summary_general_2019.csv

  general_2020_rates:
    run: stata-mp:latest analysis/100_cr_simple_rates.do "general_2020" --output-dir=output/tabfig
    needs: [general_2020_rates_cohort]
    outputs:
      moderately_sensitive:
        rates: output/tabfig/rates_summary_general_2020.csv

  pneumonia_2019_rates:
    run: stata-mp:latest analysis/100_cr_simple_rates.do "pneumonia_2019" --output-dir=output/tabfig
    needs: [pneumonia_2019_rates_cohort]
    outputs:
      moderately_sensitive:
        rates: output/tabfig/rates_summary_pneumonia_2019.csv

  append_cohorts:
    run: stata-mp:latest analysis/200_cr_data_management_matching.do --output-dir=output/cohorts
    needs: [covid_2020_rates_cohort, pneumonia_2019_rates_cohort, general_2020_rates_cohort, general_2019_rates_cohort]
    outputs:
      moderately_sensitive:
        log: output/cohorts/append_cohorts.txt
      highly_sensitive: 
        dataset: output/cohorts/combined_covid_pneumonia.dta
        dataset2: output/cohorts/combined_covid_general_2019.dta
        dataset3: output/cohorts/combined_covid_general_2020.dta

  cox_models:
    run: stata-mp:latest analysis/201_cox_models.do
    needs: [append_cohorts]
    outputs:
      moderately_sensitive:
        log: output/cohorts/cox_models.txt
        dataset: output/tabfig/cox_model_summary.csv

  describe_duration:
    run: jupyter:latest jupyter nbconvert /workspace/notebooks/describe_duration.ipynb --execute --to html --template basic --output-dir=/workspace/output --ExecutePreprocessor.timeout=86400 --no-input
    needs: [covid_2020_rates_cohort, general_2019_rates_cohort, general_2020_rates_cohort, pneumonia_2019_rates_cohort]
    outputs:
      moderately_sensitive:
        notebook: output/describe_duration.html
        table: output/tabfig/med_iqr_overall.csv
        table2: output/tabfig/med_iqr_age_group.csv
        table3: output/tabfig/med_iqr_sex.csv
        table4: output/tabfig/med_iqr_ethnicity.csv
        table5: output/tabfig/med_iqr_imd.csv
        table6: output/tabfig/med_iqr_region.csv

  rates_over_time:
    run: jupyter:latest jupyter nbconvert /workspace/notebooks/rates_over_time.ipynb --execute --to html --template basic --output-dir=/workspace/output --ExecutePreprocessor.timeout=86400 --no-input
    needs: [generate_study_population_covid_2020, generate_study_population_general_2019, generate_study_population_general_2020, generate_study_population_pneumonia_2019]
    outputs:
      moderately_sensitive:
        notebook: output/rates_over_time.html

Timeline

Created: 2 years, 4 months ago 01 Dec 2021 01:28:21 UTC
Started: 2 years, 4 months ago 01 Dec 2021 01:28:34 UTC
Finished: 2 years, 4 months ago 02 Dec 2021 07:34:19 UTC
Runtime: 60:14:19

These timestamps are generated and stored using the UTC timezone on the TPP backend.

Job information

Status: Succeeded
Backend: TPP
Workspace: long-covid-sick-notes
Requested by: Alex Walker
Branch: master
Force run dependencies: Yes
Git commit hash: 1822936
Requested actions: run_all

Code comparison

Compare the code used in this Job Request