Job request: 18218

Organisation:: University of Manchester
Workspace:: main_pregnancy_tx_pathways
ID:: aa7e7rua7tm37xyn

This page shows the technical details of what happened when the authorised researcher Vicki Palin UoM requested one or more actions to be run against real patient data within a secure environment.

By cross-referencing the list of jobs with the pipeline section below, you can infer what security level the outputs were written to.

The output security levels are:

highly_sensitive
- Researchers can never directly view these outputs
- Researchers can only request code is run against them
moderately_sensitive
- Can be viewed by an approved researcher by logging into a highly secure environment
- These are the only outputs that can be requested for public release via a controlled output review service.

Jobs

Action:

generate_6wk_cohort

Status:

Status: Succeeded

Job identifier:

r5uysomarg4nlcyh
Action:

generate_12wk_cohort

Status:

Status: Succeeded

Job identifier:

ccrbott2vibbh5xq
Action:

generate_8wk_cohort

Status:

Status: Succeeded

Job identifier:

5fci2sjahna6o24f

Pipeline

Show project.yaml

version: '3.0'

expectations:
  population_size: 1000

actions:

  # this is for number of matches
  generate_study_population:
    run: cohortextractor:latest generate_cohort --study-definition study_definition 
    outputs:
      highly_sensitive:
        cohort: output/input.csv

  # this is to generate a date file for each month
  # generate_study_population_monthly:
  #   run: cohortextractor:latest generate_cohort 
  #     --study-definition study_definition_monthly 
  #     --index-date-range "2019-01-01 to today by month"
  #     --output-dir=output 
  #     --output-format=csv.gz 
  #   outputs:
  #     highly_sensitive:
  #       cohort: output/input_*.csv.gz

  generate_study_population_measures:
    run: cohortextractor:latest generate_cohort 
      --study-definition study_definition_measures 
      --index-date-range "2019-01-01 to today by month" --skip-existing 
      --output-dir=output/measures 
      --output-format=csv.gz 
      --param num_days=84 
    outputs:
      highly_sensitive:
        cohort: output/measures/input_*.csv.gz

## num_days added to study def measures, converted to integer,
## and added to pn_8wk_present variable in study defs

  generate_12wk_cohort:
    run: cohortextractor:latest generate_cohort 
      --study-definition study_definition_measures
      --index-date-range "2019-01-01 to today by month" --skip-existing 
      --output-format csv.gz
      --param num_days=84
      --output-dir=output/pn12wk
    outputs:
      highly_sensitive:
        cohort: output/pn12wk/input_*.csv.gz
  
  generate_8wk_cohort:
    run: cohortextractor:latest generate_cohort
      --study-definition study_definition_measures 
      --index-date-range "2019-01-01 to today by month" --skip-existing 
      --output-format csv.gz
      --param num_days=56
      --output-dir=output/pn8wk
    outputs:
      highly_sensitive:
        cohort: output/pn8wk/input_*.csv.gz

  generate_6wk_cohort:
    run: cohortextractor:latest generate_cohort 
      --study-definition study_definition_measures
      --index-date-range "2019-01-01 to today by month" --skip-existing 
      --output-format csv.gz
      --param num_days=42
      --output-dir=output/pn6wk
    outputs:
      highly_sensitive:
        cohort: output/pn6wk/input_*.csv.gz

  ## generate measures for each param (above)
  generate_measures:
    run: cohortextractor:latest generate_measures --study-definition study_definition_measures --skip-existing --output-dir=output/measures
    needs: [generate_study_population_measures]
    outputs:
      moderately_sensitive:
        measure_csv: output/measures/measure_*.csv

  generate_measures_12wk:
    run: cohortextractor:latest generate_measures 
      --study-definition study_definition_measures 
      --skip-existing 
      --output-dir=output/pn12wk
      --param num_days=84
    needs: [generate_12wk_cohort]
    outputs:
      moderately_sensitive:
        measure_csv: output/pn12wk/measure_*.csv

  generate_measures_8wk:
    run: cohortextractor:latest generate_measures 
      --study-definition study_definition_measures 
      --skip-existing 
      --output-dir=output/pn8wk
      --param num_days=56
    needs: [generate_8wk_cohort]
    outputs:
      moderately_sensitive:
        measure_csv: output/pn8wk/measure*.csv

  generate_measures_6wk:
    run: cohortextractor:latest generate_measures 
      --study-definition study_definition_measures 
      --skip-existing 
      --output-dir=output/pn6wk
      --param num_days=42
    needs: [generate_6wk_cohort]
    outputs:
      moderately_sensitive:
        measure_csv: output/pn6wk/measure_*.csv

  describe_del_code_freq:
    run: r:latest analysis/del_code_frequency.R
    needs: [generate_study_population]
    outputs:
      moderately_sensitive:
        hist1: output/del_code_histogram.jpeg
        table1: output/table_del_codes.csv

  describe_del_code_freq_with_names:
    run: r:latest analysis/del_code_frequency_with_names.R
    needs: [generate_study_population, describe_del_code_freq]
    outputs:
      moderately_sensitive:
        table1: output/table_del_codes_with_names.csv

  describe_del_code_freq_with_names_reduced:
    run: r:latest analysis/del_code_frequency_with_names_reduced.R
    needs: [generate_study_population, describe_del_code_freq_with_names]
    outputs:
     moderately_sensitive:
        table1: output/table_del_codes_with_names_reduced.csv
        
  describe_pn_code_freq:
    run: r:latest analysis/pn_code_frequency.R
    needs: [generate_study_population]
    outputs:
      moderately_sensitive:
        table1: output/table_pn_codes.csv

  describe_pn_code_freq_with_names:
    run: r:latest analysis/pn_code_frequency_with_names.R
    needs: [generate_study_population, describe_pn_code_freq]
    outputs:
      moderately_sensitive:
        table1: output/table_pn_codes_with_names.csv   

  describe_pn_code_freq_with_names_reduced:
    run: r:latest analysis/pn_code_frequency_with_names_reduced.R
    needs: [generate_study_population, describe_pn_code_freq_with_names]
    outputs:
     moderately_sensitive:
        table1: output/table_pn_codes_with_names_reduced.csv   

  describe_pn_rate_plots:
    run: r:latest analysis/pn_check_using_measures.R
    needs: [generate_study_population_measures, generate_measures]
    outputs:
      moderately_sensitive:
        plot1: output/monthly_pn_rate_measures8wkcode.jpeg

  describe_pn_rate_plots_by_age_cat:
    run: r:latest analysis/pn_check_using_measures_by_age_cat.R
    needs: [generate_study_population_measures, generate_measures]
    outputs:
      moderately_sensitive:
        plot2: output/monthly_pn_rate_measures8wkcode_by_age_cat.jpeg

  describe_pn_rate_plots_by_ethnicity:
    run: r:latest analysis/pn_check_using_measures_by_ethnicity.R
    needs: [generate_study_population_measures, generate_measures]
    outputs:
      moderately_sensitive:
        plot3: output/monthly_pn_rate_measures8wkcode_by_ethnicity.jpeg

  describe_pn_rate_plots_by_imd:
    run: r:latest analysis/pn_check_using_measures_by_imd.R
    needs: [generate_study_population_measures, generate_measures]
    outputs:
      moderately_sensitive:
        plot4: output/monthly_pn_rate_measures8wkcode_by_imd.jpeg
 
  describe_pn_rate_plots_by_practice:
    run: r:latest analysis/pn_check_using_measures_by_practice.R
    needs: [generate_study_population_measures, generate_measures]
    outputs:
      moderately_sensitive:
        plot5: output/monthly_pn_rate_measures8wkcode_by_practice.jpeg

  describe_baseline_table:
    run: r:latest analysis/baseline_table.R
    needs: [generate_study_population_measures, generate_measures]
    outputs:
      moderately_sensitive:
        table_overall: output/blt_overall.csv   
        table_before: output/blt_before.csv 
        table_after: output/blt_after.csv 
        table_overall_counts: output/overall_counts.csv
        table_counts_before: output/overall_counts_before.csv
        table_counts_after: output/overall_counts_after.csv

Timeline

Created: 2 years, 5 months ago 14 Jun 2023 14:46:29 UTC
Started: 2 years, 5 months ago 14 Jun 2023 14:46:14 UTC
Finished: 2 years, 5 months ago 15 Jun 2023 05:48:36 UTC
Runtime: 45:05:08

These timestamps are generated and stored using the UTC timezone on the TPP backend.

Job request

Status: Succeeded
Backend: TPP
Workspace: main_pregnancy_tx_pathways
Requested by: Vicki Palin UoM
Branch: main
Force run dependencies: No
Git commit hash: 354bc44
Requested actions: generate_12wk_cohort

generate_8wk_cohort

generate_6wk_cohort

Code comparison

Compare the code used in this job request